View
9
Download
0
Category
Preview:
Citation preview
Stappenplannen
STATISTIEK 3INFERENTIE VOOR HET VERGELIJKEN VAN 2 POPULATIEGEMIDDELDEN
T-TOETS EN SAMENGESTELDE SCHATTERtoets de hypothese dat er geen verschil is tussen beide populaties (versus het alternatief dat er wel een verschil is) als je weet dat de scores in beide populaties normaal verdeeld zijn met dezelfde variantie
STAP 1: FORMULEER HYPOTHESEN EN MODELLEN
= geen verschil in populatiegemiddelde Vrijheidsgraden: N1+N2-1
= wel een verschil in populatie gemiddelde Vrijheidsgraden: N1+N2-2
STAP 2: TOETSINGSGROOTHEID
SE: standaard fout Sp= gepoolde steekproefvariantie STAP 3: OVERSCHRIJDINGSKANS tabel D…<p<…p<α Ho verwerpen = wel significant p>α Ho aanvaarden = niet significant ! tweezijdig= x2
STAP 4: EFFECTMAAT: 95% BI
95% BI = […..;…..]
CONCLUSIE er is wel/geen evidentie dat de respondenten uit populatie A (N=…) gemiddeld genomen significant verschillend/hoger/lager scoren van de respondenten uit populaite B (N=…) qua score, tdf = ….<p<…./ p<…/p>… Het geschatte verschil bedraagt … punten met een 95% BI van … tot … punten
Stappenplannen
VARIANTIE ANALYSE MET 1 FACTOR (ANOVA 1) N respondenten worden opgedeeld in a groepen (at random) Afhankelijke en onafhankelijke variabelen Toets de nulhypothese dat er geen effect is van de condities op de afhankelijke variabele
EXPLORATIE kengetallen:
observaties = Ngroepen = aobservaties per groep =nj
gemiddelde variantie =S’x = nummer 3 in rekentoestel 1-var stats globaalsteekproefgemiddelde
grafisch: boxplot histogrammen
STAP 1: HYPOTHESEN EN MODELLEN
voorspelde scores onder de alternatieve hypothese: groepsgemiddelde voorspelde scores onder de nulhypothese: globaal gemiddelde van alle scores
STAP 2: TOETSSTATISTIEK
Hangt af van aantal observaties en verklaarde variantie
Teller= gemiddelde effectkwadratensom :
= tussen groep variabiliteit stuk van de totale variabiliteit die we wel kunnen verklaren aan de hand van de conditie
Hoe meer de gemiddelde van elkaar verschillen tussen condities, hoe meer verklaarde variantie we hebben
MS effect= SSeffect als we slecht 2 groepen hebben, want dan is dfeffect= 1
Noemer = gemiddelde foutenkwadratensom (uitgebreid model):
= binnengroepsvariabiliteit Maat voor de variabiliteit die we niet kunnen verklaren aan de hand van de conditie
= totale variabiliteit
Stappenplannen
Als de gemiddelden van de groepen exact gelijk zijn aan elkaar (en dus ook gelijk aan het globale gemiddelde), zal de totale variabiliteit ook gelijk zijn aan de binnengroepsvariabiliteit
STAP 3: P-WAARDE tabel E…<p<…p<α Ho verwerpen = wel significant p>α Ho aanvaarden = niet significant ! niet tweezijdig = niet x2Er is ergens/nergens een verschil in het gemiddelde tussen de groepen Principe van grote aantallen: bij grote steekproeven vinden we sneller een significant effect. Het maakt dan niet uit of de groep bestaat uit 200 respondenten of 2000 respondenten
STAP 4: EFFECTMAAT
Als 0 niet in het interval ligt, kunnen we H0 verwerpen met omdat het verschil tussen p en nul significant is (voor significantie kijken bij het niveau van betrouwbaarheid)Als 0 wel in het interval ligt, aanvaarden we H0 omdat het verschil tussen p en nul niet significant is (voor significantie kijken bij het niveau van betrouwbaarheid) Als je een samengestelde t-toets uitvoert kan je deze info gebruiken om snel het BI te berekenen omdat je de standaardfout van de schatting (SE) uit de t-statistiek kan afleiden als je het verschil tussen de gemiddelde van de twee condities kent
= proportie verklaarde variantie …% van de variantie in de afhankelijke variabelen wordt verklaard door het verschil in groepen Hangt af van de verklarende variantie percentage van de totale variantie die we kunnen verklaren aan de hand van de conditie
= zuivere proportie verklaarde variantie De zuivere proportie verklaarde variantie is meestal kleiner dan R², want de laatste overschat vaak het effect
Stappenplannen
CONCLUSIE bij het vergelijken van de groepen is er wel/geen evidentie voor een verschil in de score op de afhankelijke variabelen naarmate de onafhankelijke variabele [f(..,..)=….; ..<p/p<../ ..<p<..; R²…]. Dit betekent dat ongeveer..% van de totale variantie in de afhankelijke variabele verklaard wordt door de groepsindeling er is wel/geen evidentie voor een verschil tussen groepen/ ov wat betreft av; F(…,…)=…., ….<p<….. De gemiddelde score van groep 1 (N=…) verschilt wel/niet significant van de gemiddelde score van groep 2 (N=….)
ASSUMPTIES normaliteit: verwachten binnen elke conditie dat de scores binnen die conditie normaal verdeeld zijn.Onafhankelijkheid: vervat in iid (independent) => aannemen dat residuen (afwijkingen tov gemiddelde) zijn random getrokken. Al de mensen die in één conditie zitten, zijn onafhankelijk van elkaar.
Elke persoon moet een onafhankelijke trekking zijn uit de populatie Homoscedasticiteit: gelijke populatie-standaarddeviaties binnen de groepen: variantie van normale verdeling is gelijk.
We verwachten dat al de condities uit een normale verdeling komen met dezelfde variantieWe verwachten dus dat in elke groep dezelfde variantie te zien is
Stappenplannen
CONTRASTEN STAP 1: HYPOTHESE vermoedens: we vermoeden dat er wel/geen verschil is tussen groepen
STAP 2: TOETSSTATISTIEK
De toetsstatistiek volgt een t-verdeling met N-a vrijheidsgraden, waardoor het aantal vrijheidsgraden wijzigt door het toevoegen van extra participanten. Daarna zal je de toets op nieuw moeten uitvoeren
Als de contrasten er als volgt uit zien: c1=1, c2=0, c3=-1, c4=0; dan is g= het verschil in gemiddelde tussen conditie 1 en conditie 3= de som van vier producten, namelijk elk gemiddelde vermenigvuldigd met z’n contrastgewicht
STAP 3: P-WAARDE
Tabel DAltijd tweezijdig
2x…>p>2x…
Één gepland contrast= geen correctie uitvoeren bij de statistische inferentie Als de algemene F-toets significant is, dan bestaat er een (complex) contrast dat significant is onder de Scheffé procedure
twee geplande contrasten: is er een significant verschil in de scores in de afhankelijke variabelen tussen de condities
Complexe post hoc contrasten
Één paarsgewijs contrast + post hoc= Tukey-kramer-correctie
STAP 4: EFFECTMAATniet bij contrast
CONCLUSIE er is wel/geen significant verschil in de afhankelijke variabelen tussen conditie .. en ..; t= …, p>…/ p<… Groep 1 is scoort dus wel/niet significant meer/ minder dan groep 2er is evidentie voor de hypothese dat respondenten uit conditie 1 significant hoger/lager scoren dan respondenten uit de controle conditie
Stappenplannen
VARIANTIE-ANALYSE MET 2 FACTOREN (ANOVA 2) hoofdeffect en interactie-effect
STAP 0: VERKENNING participant dataset omzetten in een kruistabel
celgemiddelde, rijgemiddelde, kolomgemiddelde en globaal gemiddelde
Groep (cel) = gemiddelde per cel scores van mensen uit dezelfde conditie optellen en delen door het aantal mensen
Marginaal = gemiddelde per conditie cel gemiddelde optellen en delen door het aantal cellen in die rij of kolom
Globaal of = gemiddelde van alle scores marginale gemiddelde optellen en delen door het aantal rijen of kolomen
Effect parameters
Gebruiken om hoofd en interactie effecten af te lezen α≠0= hoofdeffect Aβ≠0 = hoofdeffect Bαβ≠O = interactie effect
ordinaal lijnen kruisen niet disordinaal lijnen kruisen wel
onderzoeksdesign: we hebben geen controle conditie nodig verschillende groepen met elkaar vergelijken = in verschillende condities zetten= hoofdeffecten effect van bijkomende conditie op een conditie = combinaties maken= interactieeffect
effectkwadratensom die horen bij het hoofdeffect van een unifactorieel designs zijn gelijk aan de effectkwadratensom in het bifactorieel design
STAP 1: FORMULEER HYPOTHESEN EN BIJHORENDE MODELLEN (MET EFFECT PARAMETERS Α, B, AB)
Stappenplannen
STAP 2: KEUZE & WAARDE TOETSSTATISTIEK
Teller= gemiddelde effectkwadratensom
Noemer= gemiddelde foutenkwadratensom (uitgebreid model)
STAP 3: STEEKPROEVENVERDELING EN P-WAARDEp(F…,…>…..)>….Tabel Ep-waarde niet x2
Stappenplannen
STAP 4: EFFECTMAAT
CONCLUSIE er is wel/geen significant verschil tussen groep 1 (N=…) en groep 2 (N=…) op vlak van scores op de afhankelijke variabele (F..,..=…, p>…/p<…, R²=…)
ASSUMPTIES assumpties van homoscedasticiteit en normaliteit nagaan via boxplot hoeveel? Niveaus van factor 1* niveaus van factor 2onafhankelijkheid
Stappenplannen
ENKELVOUDIGE LINEAIRE REGRESSIE-ANALYSE (ELR)toets of variabele A (ov=predictor)een significante bijdrage levert aan de voorspelling van de variabele B (av=criterium) in de populatie
STAP 0: VERKENNEN VAN DATASET kengetallen: gemiddelde, standararddeviatie (2-var stats; 3 en 6), correlatie
Grafek: spreidingsdiagramPositief lineair verband: stijgende lijn hoge scores op A gaan samen met hoge scores op B, en lage met lage Negatief lineair verband: dalende lijn
Vermoeden dat variabele A een significante bijdrage levert aan de voorspelling van variabele B Wanneer punten en de regressie lijn dicht op elkaar liggen zeggen we dat er een vermoeden is dat de predictor een goede voorspeller is voor het criterium Op basis van een residuenplot kan je de geobserveerde y-scores berekenen door voor elk punt de waarde op de x-as op te tellen met de waarde op de y-as
STAP 1: FORMULEER HYPOTHESEN EN BIJHORENDE MODELLEN
Stappenplannen
STAP 2: TOETSSTATISTIEK EN STEEKPROEVENVERDELING Geschatte regressiefunctie onder het uitgebreid model
Teller:
SStotaal
SSregNoemer
STAP 3: STEEKPROEVENVERDELING EN P-WAARDE …<p<… -> niet *2Tabel E
Stappenplannen
STAP 4: EFFECTGROOTTE
…% van de variantie in het criterium wordt verklaard door de predictor Niet: indicator van een lineair verband tussen predictor en criterium Niet: indicator van lineariteitsassumptie Niet: indicator dan enkelvoudige regressie analyse geschikt is voor de data
Het gestandaardiseerd intercept B^0 is niet gelijk aan het gestandaardiseerd intercept B^* als de gemiddelde van y en x gelijk zijn aan elkaar Het gestandaardiseerd regressiegewicht is niet gelijk aan het gestandaardiseerd regressiegewicht als de standaarddeviaties van y en x gelijk zijn aan elkaar Naarmate de totale kwadratensom groter is, zal de foutenkwadratensom van het uitgebreid model niet groter zijn als de correlatie rxy gelijk blijft Stel dat we een groep mensen met een bepaalde score op een variabele hebben. De standaarddeviatie van deze variabele zegt ons iets over hoe accuraat onze voorspelling is als we stellen dat voor een willekeurige persoon uit die groep de best mogelijke voorspelling van zijn score het gemiddelde van alle scores is
CONCLUSIE de predictor levert wel/geen significante bijdragen in de voorspelling van het criterium, F(..,..)=…., …<p<…, R²=… We kunnen met andere woorden …% van de variantie in criterium van de populatie verklaren door rekening te houden met de predictor. We voorspellen dat het criterium met … punten stijgt wanner met 1 extra punt toevoegt aan de predictor, met een …% betrouwbaarheidsintervan van …. Tot ….
De predictor levert wel/geen significante bijdrage in de voorspelling van het criterium in de populatie F(..,..)=…, …<p<…, R²=… We kunnen met andere woorden …% van de variantie in het criterium verklaren door rekening te houden met de predictor
Er is wel/geen evidentie dat de predictor een significante voorspeller is voor het criterium (F(…,…)=…; p….; R²=….). dit betekent dat ongeveer …% van de variantie in het criterium verklaard kan worden door de predictor
Als een onderzoeker beweert dat er geen significant interactie effect is en hij voornamelijk geïnteresseerd is in het hoofdeffect van A, waardoor hij factor B laat vallen dan zal na het heranalyseren van de data:
De effectkwadratensom van factor A hetzelfde blijven, de errorkwadratensom verandert De variantie die verklaard werd door het hoofdeffect van B en de interactie worden bij de unifactoriële analyse toegevoegd aan de errorkwadratensom Zak je niet plots een significant hoofdeffect vinden van A in het unifactoriele analyse
Significantie verhogen door SSerroruit te verlagen (meer factoren opnemen zullen toevallig een groot deel van de variantie verklaren)?
Neen, want dfuitgebreid verandert ook, dus de noemer van de F-statistiek wordt niet sowieso groter Neen, want de F-statistiek volgt een andere verdeling, dus de p-waarde verandert Neen, want de teller van het hoofdeffect van de condities blijft wel gelijk
Stappenplannen
Kan het geschatte regressiegewicht vrijwel gelijk zijn aan nul, terwijl de proportie verklaarde variantie toch behoorlijk is?
Ja, als Sy klein en Sx groot is
Std.error of the estemate ‘Standard error of the estimate’, ofwel de standaardfout van schatting, is de alternatieve benaming voor de schatter van de populatiestandaardafwijking σˆ . Dit is gelijk aan de wortel van de foutenkwadratensom onder het uitgebreid model, ofwel √MSError|Uitgebreid.MSError|uitgebreid is wel gelijk aan de onverklaarde variantie, maar de wortel hiervan niet.SE(β1) is de standaardfout specifiek voor de schatting van het regressiegewicht β1 (staat in de noemer van de bijhorende t-statistiek). Deze vind je in de SPSS-uitvoer terug in de ‘coëfficiënten-uitvoer’ op de lijn van de tstatistiekenvan β0 en β1.Dit is gelijk aan de schatter van de populatiestandaardafwijking σ , zonder wortel in de opgave is dit wel correct
ASSUMPTIES onafhankelijkheid homoscedasticiteit normaliteit lineariteit
CENTREREN is zinvol wanneer je na centreren kunnen we met het geschatte intercept voor iemand met een gemiddelde score op y de score op x voorspellen
Stappenplannen
MEERVOUDIGE LINEAIRE REGRESSIE ANALYSE (MLR) toets of predictor 2 een significante bijdragen levert aan de voorspelling van het criterium bovenop predictor 1
STAP 0: VERKEN DE DATASET kengetallen: gemiddelde, correlaties (ry1, ry2, r12 correlatie tussen verschillende predictoren en criterium) via 2-var stats
Spreidingdiagram: onderlingen correlaties bekijken Zegt nis over de unieke info, deze samenhang moet je eerst nog ‘corrigeren’ door de overlap met de andere predictoren er uit te halen
STAP 1: FORMULEER HYPOTHESEN EN BIJHORENDE MODELLEN
Geschatte regressiefunctie onder het uitgebreid model
Geschatte regressiefunctie onder uitgebreid model Regressiegewicht: voor wie 1 punt stijgt op de variabel X1 en dezelfde score op x2 behoudt, schatten we dat de score op y met … stijgt/daalt De grootte van het regressiegewicht 2 β ˆ vertelt niet hoe groot de bijdrage is van X2 in de voorspelling van Y ten opzichte van de regressiegewichten van de andere predictoren! Deze zijn niet onderling vergelijkbaar (maar de gestandaardiseerde regressiegewichten wel). De regressiegewichten zijn wel altijd ‘contextafhankelijk’, de waarde ervan hangt af van de andere predictoren in het model.
Stappenplannen
STAP 2: TOETSSTATISTIEK EN STEEKPROVENVERDELING
Noemer
aflezen in spss
Niet berekenen F=t²
STAP 3: STEEKPROEVENVERDELING EN P-WAARDE t-stat: 2*…>p>2*…. tweezijdig dus wel *2 Tabel D
Of f-stat: ….>p>…. niet *2 tabel E
STAP 4: BEPAAL EFFECTGROOTTE
Totale proportie verklaarde variantie: …% van de variantie in het criterium wordt verklaard door beide predictoren samen Is afhankelijk van de correlatie tussen de verschillende predictoren
Partcorrelatie: …% van de variantie in het criterium wordt verklaard door predictor 1 bovenop predictor 2
We voorspellen dat wie 1 punt hoger schoort op x2, gemiddelde … scores verschild ten opzichten van y, in de veronderstelling dat de score op x1 constant blijft met een 95% BI van … tot ….
Stappenplannen
CONCLUSIE de predictor 1 levert wel/geen significante bijdragen in de voorspelling van het criterium boven op predictor 2, F(…,…)=…, …<p<…, r2
y(2,1)=… de predictor 1 voorspeld …% van de variantie in het criterium bovenop predictor 2
er is wel/ geen evidentie dat x1 een significante voorspeller is van y (t(…)=….; p…; R²=…) Dit betekent dat …% van y wordt verklaard door x1. Y stijgt met … punten (B1) als je 1 punt meer scoort op x, met een 95% BI van … tot …
Stappenplannen
SPECIALE PREDICTOREN BIJ MEERVOUDIGE LINEAIRE REGRESSIEDUMMY VARIABELEN verschil in intercept STAP 0: VERKEN DE DATASETgemiddelde lijndiagram: hoogste gemiddelde heeft hoogste lijn
TUSSENSTAP: DUMMY VARIABELEN AANMAKEN kwalitatieve predictor omzetten in dummy variabelen
1 referentie groep: 0 op allesTwee dummy groepen met telkens een 1 of een 0 op hun score
STAP 1: FORMULEER MODELLEN EN HYPOTHESES
Geschatte regressiefunctie
B2 kan ook B3 zijn, afhankelijk van hoeveel groepen STAP 2, 3 EN 4: TOETS STATISTIEK, P-WAARDE EN EFFECTMAAT aflezen in anova tabel
CONCLUSIE de respondenten uit groep 1 score gemiddelde … punten hoger/ lager op Y dan de respondenten uit de referentie groep, na controle van variabele X1; t(n-p-1)=…, p</ p>…., 95% BI[...;…]
Stappenplannen
PRODUCTTERMEN voor elke dummy een productterm toevoegen = de vermenigvuldiging van de kwantitatieve variabelen met de dummy variabelen (0 of 1)interactie effect toetsen, verschil in helling
STAP 0: VERKEN DE DATASET vergelijken van lijndiagrammen vermoeden interactie effect: lijnen lopen niet gelijk
TUSSENSTAP: PRODUCTTERMEN AANMAKENbinnengroepsregressielijnen
STAP 1: FORMULEER HYPOTHESEN EN MODELLEN
Geschatte regressie functie
STAP 2,3 EN 4: TOETSSTATISTIEK, P-WAARDE EN EFFECTMAAT afleiden uit anova tabel
CONCLUSIE gemiddeld genomen score respondenten uit groep 1 … punten hoger/lager op Y dan respondenten uit de referentie groep. Het verschil blijkt wel/niet significant; t(n-p-1):….,p=…., 95% BI […;…]
Stappenplannen
PRODUCT TERM: KWANTITATIEF interactie effect
STAP 0: VERKEN DE DATA 3 afzonderlijke spreidingsdiagrammen
Lage scores Hoge scores Gemiddelde scores
Gemiddelde +/- standaard deviatie Binnen score regressie lijnen Interactie effect: lijnen lopen niet gelijk
TUSSENSTAP: PRODUCTTERMEN AANMAKEN X1*X2=X3= productterm
STAP 1: FORMULEER HYPOTHESEN EN BIJHORENDE MODELLEN
STAP 2, 3 EN 4: TOETSSTATISTIEK, P-WAARDE EN EFFECTMAAT
Interactie effect in beide richtingen interpreteren CONCLUSIE
Stappenplannen
het verband tussen X1 en Y verschilt wel/niet significant tussen verschillende groepen; B3=…., t(..)=…,p=…, 95%BI[…;…]
na centreren blijft de t-statistiek en het significantieniveau van de interactie hetzelfde als je de interactie weg haalt blijven voor en na centreren … hetzelfde
de geschatte regressiegewichten van de predictoren de standaardfout van schatting van de regressiegewichten van de predictoren de t-statistiek van het hoofdeffect
na centreren is de gemiddelde score 0
VARIANTIE-ANALYSE MET COVARIAAT STAP 0: VERKEN DE DATA gecodeerd spreidingsdiagram kijken welke groep gemiddeld het hoogste/ laagste scoort en wat het verband is binnen die groep (positief of negatief lineair)
STAP 1: FORMULEER HYPOTHESEN EN MODELLEN
Regressiefunctie
STAP 2,3 EN 4: TOETSSTATISTIEK, P-WAARDE EN EFFECTMAAT aflezen uit anova uitvoer
Toetsstatistieken en steekproefvergelijking
Stappenplannen
Effectgrootte
CONCLUSIE er is wel/geen significant verschil tussen de groepen, na controle voor x1, op vlak van y; F…:…., p</p>…, R²partial=….
OPTIONEEL: VERGELIJKING MET ANOVA
OPTIONEEL: ADJUSTED MEANS BEREKENEN
Stappenplannen
MEDIATIE-ANALYSE
STAP 1: REGRESSIE VAN Y OP T
STAP 2: REGRESSIE VAN M OP T
REGRESSIE VAN Y OP M EN T
Stappenplannen
TYPES VAN EFFECTEN
SIGNIFICANT ‘NETTO’ EFFECT OF VOLLEDIGE MEDIATIE
SIGNIFICANT MEDIATIE-EFFECT OF PARTIËLE MEDIATIE ? HYPOTHESEN
TOETSSTATISTIEK
P-WAARDE p=2*P(Z</>…)=2*….=….Tweezijdig dus x2EFFECTMAAT
Recommended