pedagogischekringleuven.files.wordpress.com · Web viewStatistiek 3 inferentie voor het vergelijken...

Stappenplannen

STATISTIEK 3INFERENTIE VOOR HET VERGELIJKEN VAN 2 POPULATIEGEMIDDELDEN

T-TOETS EN SAMENGESTELDE SCHATTERtoets de hypothese dat er geen verschil is tussen beide populaties (versus het alternatief dat er wel een verschil is) als je weet dat de scores in beide populaties normaal verdeeld zijn met dezelfde variantie

STAP 1: FORMULEER HYPOTHESEN EN MODELLEN

= geen verschil in populatiegemiddelde Vrijheidsgraden: N1+N2-1

= wel een verschil in populatie gemiddelde Vrijheidsgraden: N1+N2-2

STAP 2: TOETSINGSGROOTHEID

SE: standaard fout Sp= gepoolde steekproefvariantie STAP 3: OVERSCHRIJDINGSKANS tabel D…<p<…p<α Ho verwerpen = wel significant p>α Ho aanvaarden = niet significant ! tweezijdig= x2

STAP 4: EFFECTMAAT: 95% BI

95% BI = […..;…..]

CONCLUSIE er is wel/geen evidentie dat de respondenten uit populatie A (N=…) gemiddeld genomen significant verschillend/hoger/lager scoren van de respondenten uit populaite B (N=…) qua score, tdf = ….<p<…./ p<…/p>… Het geschatte verschil bedraagt … punten met een 95% BI van … tot … punten

Stappenplannen

VARIANTIE ANALYSE MET 1 FACTOR (ANOVA 1) N respondenten worden opgedeeld in a groepen (at random) Afhankelijke en onafhankelijke variabelen Toets de nulhypothese dat er geen effect is van de condities op de afhankelijke variabele

EXPLORATIE kengetallen:

observaties = Ngroepen = aobservaties per groep =nj

gemiddelde variantie =S’x = nummer 3 in rekentoestel 1-var stats globaalsteekproefgemiddelde

grafisch: boxplot histogrammen

STAP 1: HYPOTHESEN EN MODELLEN

voorspelde scores onder de alternatieve hypothese: groepsgemiddelde voorspelde scores onder de nulhypothese: globaal gemiddelde van alle scores

STAP 2: TOETSSTATISTIEK

Hangt af van aantal observaties en verklaarde variantie

Teller= gemiddelde effectkwadratensom :

= tussen groep variabiliteit stuk van de totale variabiliteit die we wel kunnen verklaren aan de hand van de conditie

Hoe meer de gemiddelde van elkaar verschillen tussen condities, hoe meer verklaarde variantie we hebben

MS effect= SSeffect als we slecht 2 groepen hebben, want dan is dfeffect= 1

Noemer = gemiddelde foutenkwadratensom (uitgebreid model):

= binnengroepsvariabiliteit Maat voor de variabiliteit die we niet kunnen verklaren aan de hand van de conditie

= totale variabiliteit

Stappenplannen

Als de gemiddelden van de groepen exact gelijk zijn aan elkaar (en dus ook gelijk aan het globale gemiddelde), zal de totale variabiliteit ook gelijk zijn aan de binnengroepsvariabiliteit

STAP 3: P-WAARDE tabel E…<p<…p<α Ho verwerpen = wel significant p>α Ho aanvaarden = niet significant ! niet tweezijdig = niet x2Er is ergens/nergens een verschil in het gemiddelde tussen de groepen Principe van grote aantallen: bij grote steekproeven vinden we sneller een significant effect. Het maakt dan niet uit of de groep bestaat uit 200 respondenten of 2000 respondenten

STAP 4: EFFECTMAAT

Als 0 niet in het interval ligt, kunnen we H0 verwerpen met omdat het verschil tussen p en nul significant is (voor significantie kijken bij het niveau van betrouwbaarheid)Als 0 wel in het interval ligt, aanvaarden we H0 omdat het verschil tussen p en nul niet significant is (voor significantie kijken bij het niveau van betrouwbaarheid) Als je een samengestelde t-toets uitvoert kan je deze info gebruiken om snel het BI te berekenen omdat je de standaardfout van de schatting (SE) uit de t-statistiek kan afleiden als je het verschil tussen de gemiddelde van de twee condities kent

= proportie verklaarde variantie …% van de variantie in de afhankelijke variabelen wordt verklaard door het verschil in groepen Hangt af van de verklarende variantie percentage van de totale variantie die we kunnen verklaren aan de hand van de conditie

= zuivere proportie verklaarde variantie De zuivere proportie verklaarde variantie is meestal kleiner dan R², want de laatste overschat vaak het effect

Stappenplannen

CONCLUSIE bij het vergelijken van de groepen is er wel/geen evidentie voor een verschil in de score op de afhankelijke variabelen naarmate de onafhankelijke variabele [f(..,..)=….; ..<p/p<../ ..<p<..; R²…]. Dit betekent dat ongeveer..% van de totale variantie in de afhankelijke variabele verklaard wordt door de groepsindeling er is wel/geen evidentie voor een verschil tussen groepen/ ov wat betreft av; F(…,…)=…., ….<p<….. De gemiddelde score van groep 1 (N=…) verschilt wel/niet significant van de gemiddelde score van groep 2 (N=….)

ASSUMPTIES normaliteit: verwachten binnen elke conditie dat de scores binnen die conditie normaal verdeeld zijn.Onafhankelijkheid: vervat in iid (independent) => aannemen dat residuen (afwijkingen tov gemiddelde) zijn random getrokken. Al de mensen die in één conditie zitten, zijn onafhankelijk van elkaar.

Elke persoon moet een onafhankelijke trekking zijn uit de populatie Homoscedasticiteit: gelijke populatie-standaarddeviaties binnen de groepen: variantie van normale verdeling is gelijk.

We verwachten dat al de condities uit een normale verdeling komen met dezelfde variantieWe verwachten dus dat in elke groep dezelfde variantie te zien is

Stappenplannen

CONTRASTEN STAP 1: HYPOTHESE vermoedens: we vermoeden dat er wel/geen verschil is tussen groepen

STAP 2: TOETSSTATISTIEK

De toetsstatistiek volgt een t-verdeling met N-a vrijheidsgraden, waardoor het aantal vrijheidsgraden wijzigt door het toevoegen van extra participanten. Daarna zal je de toets op nieuw moeten uitvoeren

Als de contrasten er als volgt uit zien: c1=1, c2=0, c3=-1, c4=0; dan is g= het verschil in gemiddelde tussen conditie 1 en conditie 3= de som van vier producten, namelijk elk gemiddelde vermenigvuldigd met z’n contrastgewicht

STAP 3: P-WAARDE

Tabel DAltijd tweezijdig

2x…>p>2x…

Één gepland contrast= geen correctie uitvoeren bij de statistische inferentie Als de algemene F-toets significant is, dan bestaat er een (complex) contrast dat significant is onder de Scheffé procedure

twee geplande contrasten: is er een significant verschil in de scores in de afhankelijke variabelen tussen de condities

Complexe post hoc contrasten

Één paarsgewijs contrast + post hoc= Tukey-kramer-correctie

STAP 4: EFFECTMAATniet bij contrast

CONCLUSIE er is wel/geen significant verschil in de afhankelijke variabelen tussen conditie .. en ..; t= …, p>…/ p<… Groep 1 is scoort dus wel/niet significant meer/ minder dan groep 2er is evidentie voor de hypothese dat respondenten uit conditie 1 significant hoger/lager scoren dan respondenten uit de controle conditie

Stappenplannen

VARIANTIE-ANALYSE MET 2 FACTOREN (ANOVA 2) hoofdeffect en interactie-effect

STAP 0: VERKENNING participant dataset omzetten in een kruistabel

celgemiddelde, rijgemiddelde, kolomgemiddelde en globaal gemiddelde

Groep (cel) = gemiddelde per cel scores van mensen uit dezelfde conditie optellen en delen door het aantal mensen

Marginaal = gemiddelde per conditie cel gemiddelde optellen en delen door het aantal cellen in die rij of kolom

Globaal of = gemiddelde van alle scores marginale gemiddelde optellen en delen door het aantal rijen of kolomen

Effect parameters

Gebruiken om hoofd en interactie effecten af te lezen α≠0= hoofdeffect Aβ≠0 = hoofdeffect Bαβ≠O = interactie effect

ordinaal lijnen kruisen niet disordinaal lijnen kruisen wel

onderzoeksdesign: we hebben geen controle conditie nodig verschillende groepen met elkaar vergelijken = in verschillende condities zetten= hoofdeffecten effect van bijkomende conditie op een conditie = combinaties maken= interactieeffect

effectkwadratensom die horen bij het hoofdeffect van een unifactorieel designs zijn gelijk aan de effectkwadratensom in het bifactorieel design

STAP 1: FORMULEER HYPOTHESEN EN BIJHORENDE MODELLEN (MET EFFECT PARAMETERS Α, B, AB)

Stappenplannen

STAP 2: KEUZE & WAARDE TOETSSTATISTIEK

Teller= gemiddelde effectkwadratensom

Noemer= gemiddelde foutenkwadratensom (uitgebreid model)

STAP 3: STEEKPROEVENVERDELING EN P-WAARDEp(F…,…>…..)>….Tabel Ep-waarde niet x2

Stappenplannen

STAP 4: EFFECTMAAT

CONCLUSIE er is wel/geen significant verschil tussen groep 1 (N=…) en groep 2 (N=…) op vlak van scores op de afhankelijke variabele (F..,..=…, p>…/p<…, R²=…)

ASSUMPTIES assumpties van homoscedasticiteit en normaliteit nagaan via boxplot hoeveel? Niveaus van factor 1* niveaus van factor 2onafhankelijkheid

Stappenplannen

ENKELVOUDIGE LINEAIRE REGRESSIE-ANALYSE (ELR)toets of variabele A (ov=predictor)een significante bijdrage levert aan de voorspelling van de variabele B (av=criterium) in de populatie

STAP 0: VERKENNEN VAN DATASET kengetallen: gemiddelde, standararddeviatie (2-var stats; 3 en 6), correlatie

Grafek: spreidingsdiagramPositief lineair verband: stijgende lijn hoge scores op A gaan samen met hoge scores op B, en lage met lage Negatief lineair verband: dalende lijn

Vermoeden dat variabele A een significante bijdrage levert aan de voorspelling van variabele B Wanneer punten en de regressie lijn dicht op elkaar liggen zeggen we dat er een vermoeden is dat de predictor een goede voorspeller is voor het criterium Op basis van een residuenplot kan je de geobserveerde y-scores berekenen door voor elk punt de waarde op de x-as op te tellen met de waarde op de y-as

STAP 1: FORMULEER HYPOTHESEN EN BIJHORENDE MODELLEN

Stappenplannen

STAP 2: TOETSSTATISTIEK EN STEEKPROEVENVERDELING Geschatte regressiefunctie onder het uitgebreid model

Teller:

SStotaal

SSregNoemer

STAP 3: STEEKPROEVENVERDELING EN P-WAARDE …<p<… -> niet *2Tabel E

Stappenplannen

STAP 4: EFFECTGROOTTE

…% van de variantie in het criterium wordt verklaard door de predictor Niet: indicator van een lineair verband tussen predictor en criterium Niet: indicator van lineariteitsassumptie Niet: indicator dan enkelvoudige regressie analyse geschikt is voor de data

Het gestandaardiseerd intercept B^0 is niet gelijk aan het gestandaardiseerd intercept B^* als de gemiddelde van y en x gelijk zijn aan elkaar Het gestandaardiseerd regressiegewicht is niet gelijk aan het gestandaardiseerd regressiegewicht als de standaarddeviaties van y en x gelijk zijn aan elkaar Naarmate de totale kwadratensom groter is, zal de foutenkwadratensom van het uitgebreid model niet groter zijn als de correlatie rxy gelijk blijft Stel dat we een groep mensen met een bepaalde score op een variabele hebben. De standaarddeviatie van deze variabele zegt ons iets over hoe accuraat onze voorspelling is als we stellen dat voor een willekeurige persoon uit die groep de best mogelijke voorspelling van zijn score het gemiddelde van alle scores is

CONCLUSIE de predictor levert wel/geen significante bijdragen in de voorspelling van het criterium, F(..,..)=…., …<p<…, R²=… We kunnen met andere woorden …% van de variantie in criterium van de populatie verklaren door rekening te houden met de predictor. We voorspellen dat het criterium met … punten stijgt wanner met 1 extra punt toevoegt aan de predictor, met een …% betrouwbaarheidsintervan van …. Tot ….

De predictor levert wel/geen significante bijdrage in de voorspelling van het criterium in de populatie F(..,..)=…, …<p<…, R²=… We kunnen met andere woorden …% van de variantie in het criterium verklaren door rekening te houden met de predictor

Er is wel/geen evidentie dat de predictor een significante voorspeller is voor het criterium (F(…,…)=…; p….; R²=….). dit betekent dat ongeveer …% van de variantie in het criterium verklaard kan worden door de predictor

Als een onderzoeker beweert dat er geen significant interactie effect is en hij voornamelijk geïnteresseerd is in het hoofdeffect van A, waardoor hij factor B laat vallen dan zal na het heranalyseren van de data:

De effectkwadratensom van factor A hetzelfde blijven, de errorkwadratensom verandert De variantie die verklaard werd door het hoofdeffect van B en de interactie worden bij de unifactoriële analyse toegevoegd aan de errorkwadratensom Zak je niet plots een significant hoofdeffect vinden van A in het unifactoriele analyse

Significantie verhogen door SSerroruit te verlagen (meer factoren opnemen zullen toevallig een groot deel van de variantie verklaren)?

Neen, want dfuitgebreid verandert ook, dus de noemer van de F-statistiek wordt niet sowieso groter Neen, want de F-statistiek volgt een andere verdeling, dus de p-waarde verandert Neen, want de teller van het hoofdeffect van de condities blijft wel gelijk

Stappenplannen

Kan het geschatte regressiegewicht vrijwel gelijk zijn aan nul, terwijl de proportie verklaarde variantie toch behoorlijk is?

Ja, als Sy klein en Sx groot is

Std.error of the estemate ‘Standard error of the estimate’, ofwel de standaardfout van schatting, is de alternatieve benaming voor de schatter van de populatiestandaardafwijking σˆ . Dit is gelijk aan de wortel van de foutenkwadratensom onder het uitgebreid model, ofwel √MSError|Uitgebreid.MSError|uitgebreid is wel gelijk aan de onverklaarde variantie, maar de wortel hiervan niet.SE(β1) is de standaardfout specifiek voor de schatting van het regressiegewicht β1 (staat in de noemer van de bijhorende t-statistiek). Deze vind je in de SPSS-uitvoer terug in de ‘coëfficiënten-uitvoer’ op de lijn van de tstatistiekenvan β0 en β1.Dit is gelijk aan de schatter van de populatiestandaardafwijking σ , zonder wortel in de opgave is dit wel correct

ASSUMPTIES onafhankelijkheid homoscedasticiteit normaliteit lineariteit

CENTREREN is zinvol wanneer je na centreren kunnen we met het geschatte intercept voor iemand met een gemiddelde score op y de score op x voorspellen

Stappenplannen

MEERVOUDIGE LINEAIRE REGRESSIE ANALYSE (MLR) toets of predictor 2 een significante bijdragen levert aan de voorspelling van het criterium bovenop predictor 1

STAP 0: VERKEN DE DATASET kengetallen: gemiddelde, correlaties (ry1, ry2, r12 correlatie tussen verschillende predictoren en criterium) via 2-var stats

Spreidingdiagram: onderlingen correlaties bekijken Zegt nis over de unieke info, deze samenhang moet je eerst nog ‘corrigeren’ door de overlap met de andere predictoren er uit te halen

Geschatte regressiefunctie onder het uitgebreid model

Geschatte regressiefunctie onder uitgebreid model Regressiegewicht: voor wie 1 punt stijgt op de variabel X1 en dezelfde score op x2 behoudt, schatten we dat de score op y met … stijgt/daalt De grootte van het regressiegewicht 2 β ˆ vertelt niet hoe groot de bijdrage is van X2 in de voorspelling van Y ten opzichte van de regressiegewichten van de andere predictoren! Deze zijn niet onderling vergelijkbaar (maar de gestandaardiseerde regressiegewichten wel). De regressiegewichten zijn wel altijd ‘contextafhankelijk’, de waarde ervan hangt af van de andere predictoren in het model.

Stappenplannen

STAP 2: TOETSSTATISTIEK EN STEEKPROVENVERDELING

Noemer

aflezen in spss

Niet berekenen F=t²

STAP 3: STEEKPROEVENVERDELING EN P-WAARDE t-stat: 2*…>p>2*…. tweezijdig dus wel *2 Tabel D

Of f-stat: ….>p>…. niet *2 tabel E

STAP 4: BEPAAL EFFECTGROOTTE

Totale proportie verklaarde variantie: …% van de variantie in het criterium wordt verklaard door beide predictoren samen Is afhankelijk van de correlatie tussen de verschillende predictoren

Partcorrelatie: …% van de variantie in het criterium wordt verklaard door predictor 1 bovenop predictor 2

We voorspellen dat wie 1 punt hoger schoort op x2, gemiddelde … scores verschild ten opzichten van y, in de veronderstelling dat de score op x1 constant blijft met een 95% BI van … tot ….

Stappenplannen

CONCLUSIE de predictor 1 levert wel/geen significante bijdragen in de voorspelling van het criterium boven op predictor 2, F(…,…)=…, …<p<…, r2

y(2,1)=… de predictor 1 voorspeld …% van de variantie in het criterium bovenop predictor 2

er is wel/ geen evidentie dat x1 een significante voorspeller is van y (t(…)=….; p…; R²=…) Dit betekent dat …% van y wordt verklaard door x1. Y stijgt met … punten (B1) als je 1 punt meer scoort op x, met een 95% BI van … tot …

Stappenplannen

SPECIALE PREDICTOREN BIJ MEERVOUDIGE LINEAIRE REGRESSIEDUMMY VARIABELEN verschil in intercept STAP 0: VERKEN DE DATASETgemiddelde lijndiagram: hoogste gemiddelde heeft hoogste lijn

TUSSENSTAP: DUMMY VARIABELEN AANMAKEN kwalitatieve predictor omzetten in dummy variabelen

1 referentie groep: 0 op allesTwee dummy groepen met telkens een 1 of een 0 op hun score

STAP 1: FORMULEER MODELLEN EN HYPOTHESES

Geschatte regressiefunctie

B2 kan ook B3 zijn, afhankelijk van hoeveel groepen STAP 2, 3 EN 4: TOETS STATISTIEK, P-WAARDE EN EFFECTMAAT aflezen in anova tabel

CONCLUSIE de respondenten uit groep 1 score gemiddelde … punten hoger/ lager op Y dan de respondenten uit de referentie groep, na controle van variabele X1; t(n-p-1)=…, p</ p>…., 95% BI[...;…]

Stappenplannen

PRODUCTTERMEN voor elke dummy een productterm toevoegen = de vermenigvuldiging van de kwantitatieve variabelen met de dummy variabelen (0 of 1)interactie effect toetsen, verschil in helling

STAP 0: VERKEN DE DATASET vergelijken van lijndiagrammen vermoeden interactie effect: lijnen lopen niet gelijk

TUSSENSTAP: PRODUCTTERMEN AANMAKENbinnengroepsregressielijnen

Geschatte regressie functie

STAP 2,3 EN 4: TOETSSTATISTIEK, P-WAARDE EN EFFECTMAAT afleiden uit anova tabel

CONCLUSIE gemiddeld genomen score respondenten uit groep 1 … punten hoger/lager op Y dan respondenten uit de referentie groep. Het verschil blijkt wel/niet significant; t(n-p-1):….,p=…., 95% BI […;…]

Stappenplannen

PRODUCT TERM: KWANTITATIEF interactie effect

STAP 0: VERKEN DE DATA 3 afzonderlijke spreidingsdiagrammen

Lage scores Hoge scores Gemiddelde scores

Gemiddelde +/- standaard deviatie Binnen score regressie lijnen Interactie effect: lijnen lopen niet gelijk

TUSSENSTAP: PRODUCTTERMEN AANMAKEN X1*X2=X3= productterm

STAP 2, 3 EN 4: TOETSSTATISTIEK, P-WAARDE EN EFFECTMAAT

Interactie effect in beide richtingen interpreteren CONCLUSIE

Stappenplannen

het verband tussen X1 en Y verschilt wel/niet significant tussen verschillende groepen; B3=…., t(..)=…,p=…, 95%BI[…;…]

na centreren blijft de t-statistiek en het significantieniveau van de interactie hetzelfde als je de interactie weg haalt blijven voor en na centreren … hetzelfde

de geschatte regressiegewichten van de predictoren de standaardfout van schatting van de regressiegewichten van de predictoren de t-statistiek van het hoofdeffect

na centreren is de gemiddelde score 0

VARIANTIE-ANALYSE MET COVARIAAT STAP 0: VERKEN DE DATA gecodeerd spreidingsdiagram kijken welke groep gemiddeld het hoogste/ laagste scoort en wat het verband is binnen die groep (positief of negatief lineair)

Regressiefunctie

STAP 2,3 EN 4: TOETSSTATISTIEK, P-WAARDE EN EFFECTMAAT aflezen uit anova uitvoer

Toetsstatistieken en steekproefvergelijking

Stappenplannen

Effectgrootte

CONCLUSIE er is wel/geen significant verschil tussen de groepen, na controle voor x1, op vlak van y; F…:…., p</p>…, R²partial=….

OPTIONEEL: VERGELIJKING MET ANOVA

OPTIONEEL: ADJUSTED MEANS BEREKENEN

Stappenplannen

MEDIATIE-ANALYSE

STAP 1: REGRESSIE VAN Y OP T

STAP 2: REGRESSIE VAN M OP T

REGRESSIE VAN Y OP M EN T

Stappenplannen

TYPES VAN EFFECTEN

SIGNIFICANT ‘NETTO’ EFFECT OF VOLLEDIGE MEDIATIE

SIGNIFICANT MEDIATIE-EFFECT OF PARTIËLE MEDIATIE ? HYPOTHESEN

TOETSSTATISTIEK

P-WAARDE p=2*P(Z</>…)=2*….=….Tweezijdig dus x2EFFECTMAAT

pedagogischekringleuven.files.wordpress.com · Web viewStatistiek 3 inferentie voor het vergelijken...

Documents

Home | Together for Better · opengaande elementen - verdeling in vleugel verbredingsprofiel samengestelde elementen - t-profiel samengestelde elementen - t-profiel versterkt

Derde toets primaire waterkeringen. Landelijke toets 2006-2011

Toets Cijferen + - Alle Gevallen

Opgaven Samengestelde Meerkeuzevragen Oefenexamen IPMA

IJkingstoets Burgerlijk Ingenieur 1 juli 2015 · IJkingstoets burgerlijk ingenieur 1 juli 2015 - reeks 1 - p. 10/12 De samengestelde oefeningen bestaan telkens uit 3 deelvragen. Samengestelde

Project 1 VOORBEREIDING TOETS

Samengestelde woordjes oefening. - VanJufMarjan · Samengestelde woordjes oefening. Druk pagina 2 t/m 5 af. Knip de vlakken uit en lamineer ze. Doel van het spel. Zoek het samengestelde

MadQ MadZ Wijzigingen voorbehouden....6 – Toets voor de instelling van de verwarmingscurve Pagina 4 7 – Toets voor installatie-informatie 8 – Toets voor emissiemeting en handbedrijf

Toets veilig internet

Frisse Scholen Toets - Handleiding

TOETS KUNST V4G4

EconLit Zoeken op auteur met samengestelde naam Universiteitsbibliotheek verder = klikken

Toets! magazine 6

introductie -toets voor homogeniteit toetsendestatistiek€¦ · introductie χ2-toets voor onafhankelijkheid pauze χ2-toets voor homogeniteit χ2-toets voor goodness-of-ﬁt ten

Blog Het gebroken en samengestelde gezin

INDUSTRIALISATIE TOETS 487 - Histoforumhistoforum.net/toetsmateriaaltijdvakken/Industrialisatie.pdf · Groot INDUSTRIALISATIE Steenkool Revolutie -Brittannië Duitsland TOETS 1713

Mc toets beweging en richting

Presentatie-toets en leer

Planten H6 Toets Klas1ab

hetelucht friteuse GF500HLD · 7. Automatische menu´s 8. Thermostaat indicatie 9. Display 10. Standby indicatie - stop toets 11. Menu toets 12. toets - minuten 13. 0c toets - temperatuur