View
104
Download
0
Category
Preview:
Citation preview
T-Tests und T-Tests und VarianzanalysenVarianzanalysen
PC-PraktikumPC-Praktikum
AllgemeinAllgemein
Bei all diesen Tests geht es um Bei all diesen Tests geht es um Zusammenhänge zwischen 2 oder mehr Zusammenhänge zwischen 2 oder mehr Variablen.Variablen.
Dabei ist die abhängige Variable(AV) Dabei ist die abhängige Variable(AV) mindestens Intervallskalenniveau und die mindestens Intervallskalenniveau und die unabhängige/n Variable/n(UV) kategorial. unabhängige/n Variable/n(UV) kategorial.
Es werden die arithmetischen Mittel Es werden die arithmetischen Mittel erfasst und auf signifikante Unterschiede erfasst und auf signifikante Unterschiede geprüft.geprüft.
T-TestsT-Tests Untersuchen, ob sich die Mittelwerte zweier SP Untersuchen, ob sich die Mittelwerte zweier SP
signifikant unterscheiden (außer T-Test für eine SP: signifikant unterscheiden (außer T-Test für eine SP: Vergleich eines Mittelwertes einer SP mit beliebigen Vergleich eines Mittelwertes einer SP mit beliebigen Mittelwert )Mittelwert )
Voraussetzungen:Voraussetzungen: NormalverteilungNormalverteilung min. intervallskalierte AVmin. intervallskalierte AV dichotome UVdichotome UV Nicht zu große Stichprobenumfänge (neigt dann zu Nicht zu große Stichprobenumfänge (neigt dann zu
signifikanten Ergebnissen) und Zufallsauswahlsignifikanten Ergebnissen) und Zufallsauswahl
für T-Test für unabhängige Stichproben(SP): für T-Test für unabhängige Stichproben(SP): unabhängige (Teil-)Stichprobenunabhängige (Teil-)Stichproben
für T-Test für gepaarte SP: abhängige (Teil-)SPfür T-Test für gepaarte SP: abhängige (Teil-)SP
Quelle: Kähler 2006: 414.
T-Test bei einer SPT-Test bei einer SP
Datensatz: Master_FP_2006.savDatensatz: Master_FP_2006.sav Es geht um das Alter der Befragten: Variable: Es geht um das Alter der Befragten: Variable:
alteralter Forschungsinteresse: Wir wollen herausfinden, Forschungsinteresse: Wir wollen herausfinden,
ob sich der Altersdurchschnitt dieser Studie ob sich der Altersdurchschnitt dieser Studie signifikant vom Altersdurchschnitt des signifikant vom Altersdurchschnitt des Hochschulgesamtdatensatz unterscheidet.Hochschulgesamtdatensatz unterscheidet.
Hier wollen wir dazu den Ein-Stichproben-T-Test Hier wollen wir dazu den Ein-Stichproben-T-Test verwenden.verwenden.
andere Anwendungsmöglichkeiten: z.B. Vergleich des Durchschnittseinkommen der andere Anwendungsmöglichkeiten: z.B. Vergleich des Durchschnittseinkommen der eigenen Studie mit „offiziellem“ Durchschnittseinkommen der Gesamtbevölkerungeigenen Studie mit „offiziellem“ Durchschnittseinkommen der Gesamtbevölkerung
T-Test bei einer SPT-Test bei einer SP
Quelle: Janssen 2003: 306.
AnalysierenAnalysierenMittelwerte vergleichenMittelwerte vergleichenT-Test bei einer SPT-Test bei einer SP
Hypothesen (für zweiseitig): Hypothesen (für zweiseitig): HH00: : μμ empirempir==33,893533,8935
HH11: : μ μ empirempir ≠33,8935 ≠33,8935
T-Test bei einer SP -FensterT-Test bei einer SP -Fenster Testvariable(n)… Variable(n) bei der der Test durchgeführt werden Testvariable(n)… Variable(n) bei der der Test durchgeführt werden
sollsollhier: alterhier: alter Testwert… Wert, mit dem der empirische Mittelwert verglichen Testwert… Wert, mit dem der empirische Mittelwert verglichen
werden sollwerden sollhier: 33,8935 (aus Hochschulgesamtdatensatz)hier: 33,8935 (aus Hochschulgesamtdatensatz) Optionen: Optionen: KonfidenzintervallKonfidenzintervallFehlende Werte: Fallausschluss Test für Test... nur Ausschluss der Fehlende Werte: Fallausschluss Test für Test... nur Ausschluss der
Fälle, bei denen Fälle, bei denen in der gerade analysiertenin der gerade analysierten abhängigen oder abhängigen oder unabhängigen Variable ein fehlender Wert auftrittunabhängigen Variable ein fehlender Wert auftritt
Listenweiser Fallausschluss… Ausschluss aller Fälle, Listenweiser Fallausschluss… Ausschluss aller Fälle, in denen in in denen in irgendeinerirgendeiner dieser Variablen ein fehlender Wert auftritt dieser Variablen ein fehlender Wert auftritt
T-Test bei einer SP -AusgabenT-Test bei einer SP -Ausgaben
Statistik bei einer Stichprobe
4114 53,21 10,079 ,157Alter der BefragtenN Mittelwert
Standardabweichung
Standardfehler des
Mittelwertes
Test bei einer Sichprobe
122,930 4113 ,000 19,317 19,01 19,63Alter der BefragtenT df Sig. (2-seitig)
MittlereDifferenz Untere Obere
95% Konfidenzintervallder Differenz
Testwert = 33.8935
Freiheits-grade
|t|>tkrit=1,96 UND Sig.(2-seitig)* < 0,05
H0 ist abzulehnen (mit Irrtumswahrscheinlichkeit von 5%)
T-Wert
Streuung um den Mittelwert
Mittelwertsdifferenz: Differenz zum
Testwert
in diesem Bereich liegt mit 95%iger
Sicherheit der wahre Wert
*für 1-seitige Hypothesen: Sig.(2-seitig) durch 2 teilen
T-Test bei unabhängigen SPT-Test bei unabhängigen SP Datensatz: Master_FP_2006.savDatensatz: Master_FP_2006.sav Es geht um die Frage 51: Es geht um die Frage 51:
Menü Mittelwerte…Menü Mittelwerte… Analysieren Analysieren Mittelwerte vergleichen Mittelwerte vergleichen Mittelwerte Mittelwerte … … zum Vergleich der Mittelwerte u. a. deskriptiver Statistik sowie zum Vergleich der Mittelwerte u. a. deskriptiver Statistik sowie
Kontrolle der DrittvariablenKontrolle der Drittvariablen
Fenster: Fenster: abhängige Variablen: abhängige Variablen: f51beruff51beruf unabhängige Variablen: unabhängige Variablen: f65geschf65gesch Optionen: Optionen: ZellenstatistikZellenstatistik…was gewünscht…was gewünscht
ANOVA-Tabelle… Varianzanalyse (ohne Einbeziehung ANOVA-Tabelle… Varianzanalyse (ohne Einbeziehung der Kontrollvariablen)der Kontrollvariablen) und Eta… zur Bestimmung des Anteils der erklärtenund Eta… zur Bestimmung des Anteils der erklärten VarianzVarianz Linearitätstest… prüft, ob Zusammenhang durch lineare Linearitätstest… prüft, ob Zusammenhang durch lineare
Regression erfasst werden kann (metrische, klassifizierte UV nötig)Regression erfasst werden kann (metrische, klassifizierte UV nötig) Weiter… zur Einführung von Kontrollvariablen Weiter… zur Einführung von Kontrollvariablen
Menü Mittelwerte…Menü Mittelwerte…Verarbeitete Fälle
4022 96,3% 153 3,7% 4175 100,0%Angesehenen Berufausüben * Geschlecht
N Prozent N Prozent N Prozent
Eingeschlossen Ausgeschlossen Insgesamt
Fälle
Bericht
Angesehenen Beruf ausüben
2,89 1294 1,156 1,335
2,68 2728 1,148 1,318
2,75 4022 1,154 1,332
GeschlechtWeiblich
Männlich
Insgesamt
Mittelwert NStandardabweichung Varianz
Forschungsinteresse: Sind die Mittelwertunterschiede signifikant oder zufällig?
Prüfung mit 2-Stichproben-T-Test für unabhängige SP
T-Test bei unabhängigen SPT-Test bei unabhängigen SP AnalysierenAnalysierenMittelwerte vergleichenMittelwerte vergleichenT-Test bei unabhängigen SPT-Test bei unabhängigen SP
Hypothesen (für zweiseitig): Hypothesen (für zweiseitig): HH00: : μμweibl= weibl= μμmännlmännl
HH11: : μ μ weiblweibl ≠ ≠ μμmännlmännl
Fenster:Fenster: Testvariable(n) Testvariable(n) hier: f51berufhier: f51beruf Gruppenvariable…UV Gruppenvariable…UV hier: hier: f65geschf65gesch Gruppen def.: Gruppe 1 Gruppen def.: Gruppe 1 hier: 1hier: 1 Gruppe 2 Gruppe 2 hier: 2hier: 2 Trennwert… Teilungspunkt für Trennwert… Teilungspunkt für ordinale oder metrische UVordinale oder metrische UV Bildung v. 2 GruppenBildung v. 2 Gruppen Optionen: Optionen: KonfidenzintervallKonfidenzintervallFehlende Werte: Fallausschluss Test für TestFehlende Werte: Fallausschluss Test für Test Listenweiser FallausschlussListenweiser Fallausschluss
T-Test bei unabhängigen SP -T-Test bei unabhängigen SP -AusgabenAusgaben
Gruppenstatistiken
1294 2,89 1,156 ,032
2728 2,68 1,148 ,022
GeschlechtWeiblich
Männlich
AngesehenenBeruf ausüben
N MittelwertStandardabweichung
Standardfehler des
Mittelwertes
T-Test bei unabhängigen SP -T-Test bei unabhängigen SP -AusgabenAusgaben
Test bei unabhängigen Stichproben
3,707 ,054 5,252 4020 ,000 ,204 ,039 ,128 ,280
5,239 2524,455 ,000 ,204 ,039 ,128 ,280
Varianzen sind gleich
Varianzen sind nichtgleich
Ang
eseh
enen
Ber
ufau
sübe
n
F
Sig
nifik
anz
Levene-Testder
Varianzgleichheit
T df
Sig
. (2
-sei
tig)
Mitt
lere
Diff
eren
z
Sta
ndar
dfeh
ler
der
Diff
eren
z
Unt
ere
Obe
re
95%Konfidenzint
ervall derDifferenz
T-Test für die MittelwertgleichheitF-Wert
Standardab-weichung
der Differenz
T-Test bei unabhängigen SP -T-Test bei unabhängigen SP -AusgabenAusgaben
Levene-Test für Varianzgleichheit:Levene-Test für Varianzgleichheit: HH00: Varianzen der Variablen gleich: Varianzen der Variablen gleich HH11: Varianzen sind nicht gleich: Varianzen sind nicht gleich Ergebnis: Signifikanz Ergebnis: Signifikanz > 0,05> 0,05““Varianzen sind nicht gleich” ablesenVarianzen sind nicht gleich” ablesen
T-Test:T-Test: |t||t|>>ttkritkrit=1,96 UND Sig.(2-seitig) =1,96 UND Sig.(2-seitig) < 0,05 < 0,05 HH00 ist abzulehnen (mit ist abzulehnen (mit
Irrtumswahrscheinlichkeit von 5%)Irrtumswahrscheinlichkeit von 5%)
T-Test bei gepaarten SPT-Test bei gepaarten SP
Datensatz: abm.savDatensatz: abm.sav Einkommen von Teilnehmern einer Einkommen von Teilnehmern einer
ArbeitsbeschaffungsmaßnahmeArbeitsbeschaffungsmaßnahme Forschungsinteresse: Unterschiede des Forschungsinteresse: Unterschiede des
Einkommen der Teilnehmer vor und nach der Einkommen der Teilnehmer vor und nach der ArbeitsbeschaffungsmaßnahmeArbeitsbeschaffungsmaßnahme
Prüfung mit 2-Stichproben-T-Test für Prüfung mit 2-Stichproben-T-Test für abhängige SPabhängige SP
AnalysierenAnalysierenMittelwerte vergleichenMittelwerte vergleichenT-T-Test bei gepaarten SPTest bei gepaarten SP
T-Test bei gepaarten SPT-Test bei gepaarten SP Hypothesen (für zweiseitig): Hypothesen (für zweiseitig): HH00: : μμvar225= var225= μμvar310var310
HH11: : μμvar225var225 ≠ ≠ μμvar310var310
Fenster:Fenster: Gepaarte Variablen… es sind mehrere Paare möglich Gepaarte Variablen… es sind mehrere Paare möglich
hier: hier: var225(Bruttoeinkommen vor ABM)var225(Bruttoeinkommen vor ABM) Strg-Taste Strg-Taste halten halten var310var310(erstes Bruttoeinkommen nach ABM)(erstes Bruttoeinkommen nach ABM)
Optionen: Optionen: KonfidenzintervallKonfidenzintervallFehlende Werte: Fallausschluss Test für TestFehlende Werte: Fallausschluss Test für Test Listenweiser FallausschlussListenweiser Fallausschluss
T-Test bei gepaarten SPT-Test bei gepaarten SPStatistik bei gepaarten Stichproben
2783,54 80 1284,753 143,640
2631,80 80 920,817 102,950
BRUTTOEINKOMMENVOR ABM
ERSTES BRUTTOEINK.NACH ABM
Paaren1
Mittelwert NStandardabweichung
Standardfehler des
Mittelwertes
Korrelationen bei gepaarten Stichproben
80 ,644 ,000BRUTTOEINKOMMENVOR ABM & ERSTESBRUTTOEINK.NACH ABM
Paaren1
N Korrelation Signifikanz
Korrelation recht hoch
T-Test bei gepaarten SPT-Test bei gepaarten SPTest bei gepaarten Stichproben
151,738 987,719 110,430 -68,069 371,544 1,374 79 ,173BRUTTOEINKOMMENVOR ABM - ERSTESBRUTTOEINK.NACH ABM
Paaren1
Mitt
elw
ert
Sta
ndar
dabw
eich
ung
Sta
ndar
dfeh
ler
des
Mitt
elw
erte
s
Unt
ere
Obe
re
95%Konfidenzintervall
der Differenz
Gepaarte Differenzen
T df
Sig
. (2
-sei
tig)
|t|<tkrit=1,994 UND Sig.(2-seitig) > 0,05 H0 kann nicht abgelehnt werden kein signifikanter Unterschied im Einkommen
Mittelwert der Differenzen
zwischen den Zeitpunkten
Standard-abweichung der
Differenzen zwischen den Zeitpunkten
VarianzanalysenVarianzanalysen Untersucht, ob sich die Mittelwerte von mehr als 2 SP signifikant Untersucht, ob sich die Mittelwerte von mehr als 2 SP signifikant
unterscheidenunterscheiden Prüft nur, ob Unterschied zwischen min. einem der verglichenen Prüft nur, ob Unterschied zwischen min. einem der verglichenen
Paare signifikant ist Paare signifikant ist zur Prüfung zwischen welchen zur Prüfung zwischen welchen Vergleichspaaren signifikante Differenzen: Post-Hoc-TestsVergleichspaaren signifikante Differenzen: Post-Hoc-Tests
Voraussetzungen:Voraussetzungen: UV: alle Skalenniveaus möglich, kategorisiertUV: alle Skalenniveaus möglich, kategorisiert AV: min. Intervallskalierung AV: min. Intervallskalierung Varianzhomogenität Varianzhomogenität geprüft mit Levene-Testgeprüft mit Levene-Test NormalverteilungNormalverteilung ZufallsstichprobenZufallsstichproben
Für ANOVA: unabhängige SPFür ANOVA: unabhängige SP Für Varianzanalyse mit Meßwiederholung: abhängige SPFür Varianzanalyse mit Meßwiederholung: abhängige SP
Quelle: Kähler 2006: 441.
Einfaktorielle ANOVAEinfaktorielle ANOVA
Datensatz: Master_2006_FPDatensatz: Master_2006_FP Forschungsinteresse: Frage 51Forschungsinteresse: Frage 51Gibt es Unterschiede Gibt es Unterschiede
zwischen den Geburtskohorten?zwischen den Geburtskohorten?Prüfung mit Einfaktorieller ANOVAPrüfung mit Einfaktorieller ANOVA
AnalysierenAnalysierenMittelwerte vergleichenMittelwerte vergleichenEinfaktorielle Einfaktorielle ANOVAANOVA
Hypothesen (für zweiseitig): Hypothesen (für zweiseitig):
HH00: : μμ11==μμ22=…==…=μμii
HH11: : μμ11≠≠μμ22≠…≠≠…≠μμii
Einfaktorielle ANOVAEinfaktorielle ANOVA
Fenster:Fenster: Abhängige Variablen Abhängige Variablen hier: f51berufhier: f51beruf Faktor… UV Faktor… UV hier: f66gebja_kohhier: f66gebja_koh Kontraste: Polynomial UND Grad … Erklärung derKontraste: Polynomial UND Grad … Erklärung der Summe der Abweichungsquadrate zwischenSumme der Abweichungsquadrate zwischen den Gruppen durch Polynomterme bis zurden Gruppen durch Polynomterme bis zur 5.Ordnung5.Ordnung Kontrast 1 von 1 : Koeffizienten… t-Test für a prioriKontrast 1 von 1 : Koeffizienten… t-Test für a priori festgelegte Kontrastgruppen festgelegte Kontrastgruppen Kodierung mit -1Kodierung mit -1 und +1 für zu vergleichende Gruppen und 0 für und +1 für zu vergleichende Gruppen und 0 für ausgeschlossene Gruppenausgeschlossene Gruppen (Koeffizientensumme… Koeffizienten müssen 0(Koeffizientensumme… Koeffizienten müssen 0 ergeben)ergeben)
Einfaktorielle ANOVA - Post-HocEinfaktorielle ANOVA - Post-Hoc
Post-Hoc:Post-Hoc: Varianz-Gleichheit angenommen: Varianz-Gleichheit angenommen: LSDLSD BonferroniBonferroni SidakSidak Scheffé… Vergleich der Mittelwerte undScheffé… Vergleich der Mittelwerte und Berechnung der kritischen Differenz Berechnung der kritischen Differenz hier: hier: Scheffe-TestScheffe-Test etc.etc. Keine Varianzgleichheit angenommen:Keine Varianzgleichheit angenommen: Tamhane-T2Tamhane-T2 etc.etc. Signifikanzniveau …Signifikanzniveau …angeben als ,05 etc.angeben als ,05 etc.
Einfaktorielle ANOVA - OptionenEinfaktorielle ANOVA - Optionen
Optionen: Optionen: Statistik: Deskriptive StatistikStatistik: Deskriptive Statistik Feste und zufällige Effekte: Statistiken für Modell mit Feste und zufällige Effekte: Statistiken für Modell mit festen Effekten(Standardabweichung,festen Effekten(Standardabweichung, Standardfehler, Konfidenzintervall) und zufälligenStandardfehler, Konfidenzintervall) und zufälligen Effekten(Standardfehler, Konfidenzintervall, VarianzEffekten(Standardfehler, Konfidenzintervall, Varianz zwischen Komonenten)zwischen Komonenten) Test auf Homogenität der Varianzen… Levene-testTest auf Homogenität der Varianzen… Levene-test Brown-Forsythe… Test auf Gleichheit der Mittelwerte der Brown-Forsythe… Test auf Gleichheit der Mittelwerte der Gruppen für ungleiche VarianzenGruppen für ungleiche Varianzen Welch… siehe Brown-Forsythe-TestWelch… siehe Brown-Forsythe-Test Diagramm der Mittelwerte: Liniendiagramm aus Punkten der Diagramm der Mittelwerte: Liniendiagramm aus Punkten der
Mittelwerte der GruppenMittelwerte der Gruppen Fehlende Werte: Fallauschluss Test für TestFehlende Werte: Fallauschluss Test für Test Listenweiser TestausschlussListenweiser Testausschluss
Einfaktorielle ANOVAEinfaktorielle ANOVAONEWAY deskriptive Statistiken
Angesehenen Beruf ausüben
27 2,15 1,262 ,243 1,65 2,65 1 5
342 2,19 1,066 ,058 2,08 2,31 1 5
974 2,50 1,115 ,036 2,43 2,57 1 5
1378 2,89 1,151 ,031 2,83 2,95 1 5
1134 2,93 1,125 ,033 2,87 3,00 1 5
168 2,98 1,113 ,086 2,81 3,15 1 5
4023 2,75 1,154 ,018 2,71 2,78 1 5
1,00
2,00
3,00
4,00
5,00
6,00
Gesamt
N MittelwertStandardabweichung
Standardfehler Untergrenze Obergrenze
95%-Konfidenzintervall fürden Mittelwert
Minimum Maximum
Test der Homogenität der Varianzen
Angesehenen Beruf ausüben
1,700 5 4017 ,131
Levene-Statistik df1 df2 Signifikanz
│F│< Fkrit=2,21 UND Signifikanz >0,05Varianzhomogenität falls nicht: kann Varianzanalyse nicht durchgeführt werden
F-Wert
Einfaktorielle ANOVAEinfaktorielle ANOVA
ONEWAY ANOVA
Angesehenen Beruf ausüben
250,027 5 50,005 39,364 ,000
5102,903 4017 1,270
5352,931 4022
Zwischen den Gruppen
Innerhalb der Gruppen
Gesamt
Quadratsumme df
Mittel derQuadrate F Signifikanz
Varianzen
Zerlegung der sum-mierten Ab-
weichungsquadrate in SAQzw , SAQin und
SAQge
│F│> Fkrit=2,21 UND Signifikanz <0,05signifikante Unterschiede zwischen Geburtskohorten
Mehrfachvergleiche
Abhängige Variable: Angesehenen Beruf ausüben
Scheffé-Prozedur
-,045 ,225 1,000 -,79 ,71
-,355 ,220 ,761 -1,09 ,38
-,744* ,219 ,042 -1,47 -,01
-,785* ,219 ,026 -1,52 -,05
-,834* ,234 ,026 -1,61 -,06
,045 ,225 1,000 -,71 ,79
-,310* ,071 ,002 -,55 -,07
-,699* ,068 ,000 -,93 -,47
-,740* ,070 ,000 -,97 -,51
-,789* ,106 ,000 -1,14 -,44
,355 ,220 ,761 -,38 1,09
,310* ,071 ,002 ,07 ,55
-,389* ,047 ,000 -,55 -,23
-,430* ,049 ,000 -,59 -,27
-,479* ,094 ,000 -,79 -,17
,744* ,219 ,042 ,01 1,47
,699* ,068 ,000 ,47 ,93
,389* ,047 ,000 ,23 ,55
-,041 ,045 ,975 -,19 ,11
-,090 ,092 ,966 -,40 ,22
,785* ,219 ,026 ,05 1,52
,740* ,070 ,000 ,51 ,97
,430* ,049 ,000 ,27 ,59
,041 ,045 ,975 -,11 ,19
-,049 ,093 ,998 -,36 ,26
,834* ,234 ,026 ,06 1,61
,789* ,106 ,000 ,44 1,14
,479* ,094 ,000 ,17 ,79
,090 ,092 ,966 -,22 ,40
,049 ,093 ,998 -,26 ,36
(J) geburtskohortenin Jahrzehnte1930-1939
1940-1949
1950-1959
1960-1969
ab 1970
bis 1929
1940-1949
1950-1959
1960-1969
ab 1970
bis 1929
1930-1939
1950-1959
1960-1969
ab 1970
bis 1929
1930-1939
1940-1949
1960-1969
ab 1970
bis 1929
1930-1939
1940-1949
1950-1959
ab 1970
bis 1929
1930-1939
1940-1949
1950-1959
1960-1969
(I) geburtskohortenin Jahrzehntebis 1929
1930-1939
1940-1949
1950-1959
1960-1969
ab 1970
MittlereDifferenz (I-J)
Standardfehler Signifikanz Untergrenze Obergrenze
95%-Konfidenzintervall
Die Differenz der Mittelwerte ist auf dem Niveau .05 signifikant.*.
Einfaktorielle ANOVAEinfaktorielle ANOVA
3 homogene Gruppen, deren Mittelwerte sich nicht signifikant unterscheiden:
Gruppe 1: 1-3 und Gruppe 2: 3-5 und Gruppe 3: 4-6
Angesehenen Beruf ausüben
Scheffé-Prozedura,b
27 2,15
342 2,19
974 2,50 2,50
1378 2,89 2,89
1134 2,93 2,93
168 2,98
,294 ,110 ,995
geburtskohortenin Jahrzehntebis 1929
1930-1939
1940-1949
1950-1959
1960-1969
ab 1970
Signifikanz
N 1 2 3
Untergruppe für Alpha = .05.
Die Mittelwerte für die in homogenen Untergruppen befindlichenGruppen werden angezeigt.
Verwendet ein harmonisches Mittel für Stichprobengröße =123,590.
a.
Die Gruppengrößen sind nicht identisch. Es wird dasharmonische Mittel der Gruppengrößen verwendet.Fehlerniveaus des Typs I sind nicht garantiert.
b.
Signifikanz innerhalb
den Gruppen
Weitere VarianzanalysenWeitere Varianzanalysen
AnalysierenAnalysierenAllgemeines lineares Allgemeines lineares ModellModellUnivariat… für eine AVUnivariat… für eine AV
AnalysierenAnalysierenAllgemeines lineares Allgemeines lineares ModellModellMultivariat… für mehrere AVMultivariat… für mehrere AV
AnalysierenAnalysierenAllgemeines lineares Allgemeines lineares ModellModellMeßwiederholung… Varianzanalyse für Meßwiederholung… Varianzanalyse für abhängige SPabhängige SP
AnalysierenAnalysierenAllgemeines lineares Allgemeines lineares ModellModellVarianzkomponenten… schätzt bei Varianzkomponenten… schätzt bei Modellen mit gemischten Effekten den Beitrag jedes Modellen mit gemischten Effekten den Beitrag jedes Zufallseffekts zur Varianz der abhängigen Zufallseffekts zur Varianz der abhängigen Variablen. Variablen.
2-faktorielle Varianzanalyse2-faktorielle Varianzanalyse Kann auch Wirkung ihrer Kombination(Interaktion) untersuchenKann auch Wirkung ihrer Kombination(Interaktion) untersuchen gleiche Zellhäufigkeiten… alle Zellen mit gleicher Anzahl der Fälle gleiche Zellhäufigkeiten… alle Zellen mit gleicher Anzahl der Fälle
besetztbesetzt wechselseitig voneinander unabhängig wechselseitig voneinander unabhängig Gegenteil: ungleiche Zellhäufigkeiten: Effekte korrelieren Gegenteil: ungleiche Zellhäufigkeiten: Effekte korrelieren
miteinandermiteinander
Datensatz: allbus90.savDatensatz: allbus90.sav Forschungsinteresse: Welchen Einfluss hat der Schulbildung und Forschungsinteresse: Welchen Einfluss hat der Schulbildung und
das Geschlecht auf das Einkommen unter Kontrolle der Variablen das Geschlecht auf das Einkommen unter Kontrolle der Variablen Alter?Alter?
Prüfung mit 2-faktorieller VarianzanalysePrüfung mit 2-faktorieller Varianzanalyse
AnalysierenAnalysierenAllgemeines lineares ModellAllgemeines lineares ModellUnivariatUnivariat
AnalysierenAnalysierenAllgemeines lineares Allgemeines lineares ModellModellUnivariatUnivariat
Univariat:Univariat: Abhängige Variable Abhängige Variable hier: einkhier: eink Feste Faktoren… alle relevanten Merkmale des Faktors sindFeste Faktoren… alle relevanten Merkmale des Faktors sind durch Untersuchungsanordnung vorgegebendurch Untersuchungsanordnung vorgegebenhier: geschl, schul2hier: geschl, schul2 Zufallsfaktoren… kommen durch bzgl. dieses Merkmals Zufallsfaktoren… kommen durch bzgl. dieses Merkmals zufällige Zuweisung von Fällen zu zufällige Zuweisung von Fällen zu Untersuchungsgruppen zustandeUntersuchungsgruppen zustande Kovariaten… zusätzliche Einführung einer mit Kovariaten… zusätzliche Einführung einer mit metrischen Variable (wichtig: keine metrischen Variable (wichtig: keine Korrelation zu Faktoren) Korrelation zu Faktoren) KontrollvariableKontrollvariablehier: althier: alt WLS-Gewichtung… für Gewichtung der Fälle WLS-Gewichtung… für Gewichtung der Fälle (vorher Gewichtungsvariable bilden)(vorher Gewichtungsvariable bilden)
AnalysierenAnalysierenAllgemeines lineares Allgemeines lineares ModellModellUnivariatUnivariat
Modell: Modell: Gesättigtes ModellGesättigtes Modell… alle Faktoren und Kovariate sowie … alle Faktoren und Kovariate sowie Wechselwirkungen zwischenWechselwirkungen zwischen Faktoren Faktoren gehen ins Modell ein gehen ins Modell ein hier: gesättigtes Modellhier: gesättigtes Modell AnpassenAnpassen… Auswahl der Haupteffekte (Faktoren und Kovariate) … Auswahl der Haupteffekte (Faktoren und Kovariate) und Wechselwirkungen (auch mit Kovariaten), die in Modellund Wechselwirkungen (auch mit Kovariaten), die in Modell eingehen solleneingehen sollen Term(e) konstruieren: u.a. Alle ?-Weg… Wechselwirkungen der Term(e) konstruieren: u.a. Alle ?-Weg… Wechselwirkungen der ?.Ordnung?.Ordnung QuadratsummeQuadratsumme… zur Berechnung der Summe der Abweichungen… zur Berechnung der Summe der Abweichungen Typ I… Hierarchisch: Jeder Term wird nur für die in derTyp I… Hierarchisch: Jeder Term wird nur für die in der Liste vor ihm stehenden korrigiertListe vor ihm stehenden korrigiertReihenfolge hat EinflussReihenfolge hat Einfluss auf Ergebnisauf Ergebnis Typ II: Regressionsmodell: Berechnung der Haupteffekte um Typ II: Regressionsmodell: Berechnung der Haupteffekte um alle anderen Terme (außer Interaktionen) korrigiertalle anderen Terme (außer Interaktionen) korrigiert Typ III: Berechnung der Quadratsumme eines Effekts um alle Typ III: Berechnung der Quadratsumme eines Effekts um alle anderen Effekte bereinigt, die nicht im Effekt enthalten sindanderen Effekte bereinigt, die nicht im Effekt enthalten sind robust gegenüber ungleichen Zellhäufigkeitenrobust gegenüber ungleichen Zellhäufigkeiten ungeeignet für leere Zellenungeeignet für leere Zellen Typ IV: für leere Zellen Typ IV: für leere Zellen
AnalysierenAnalysierenAllgemeines lineares Allgemeines lineares ModellModellUnivariatUnivariat
Kontraste… Vergleich von Gruppen (nur 1 Faktor) über a prioriKontraste… Vergleich von Gruppen (nur 1 Faktor) über a priori definierte Kontraste (ähnlich wie bei ANOVA): definierte Kontraste (ähnlich wie bei ANOVA):
Einfach… Vergleich der Mittelwerte aller Faktorstufen (außerEinfach… Vergleich der Mittelwerte aller Faktorstufen (außer Referenzkategorie) mit Mittelwert derReferenzkategorie) mit Mittelwert der ReferenzkategorieReferenzkategorie Wiederholt… Vergleich des Mittelwerts jeder Faktorstufe Wiederholt… Vergleich des Mittelwerts jeder Faktorstufe (außer der letzten) mit dem Mittelwert der(außer der letzten) mit dem Mittelwert der folgenden Faktorstufefolgenden Faktorstufe Polynomial… Vergleich des linearen etc. Effekts Polynomial… Vergleich des linearen etc. Effekts für für Schätzung von polynomialen TrendsSchätzung von polynomialen Trends etc.etc.
Referenzkategorie… erste oder letzte FaktorstufeReferenzkategorie… erste oder letzte Faktorstufe
AnalysierenAnalysierenAllgemeines lineares Allgemeines lineares ModellModellUnivariatUnivariat
Diagramme: Profilplots… stellen den Diagramme: Profilplots… stellen den Zusammenhang zwischen max. Zusammenhang zwischen max. 2 Faktoren und der AV dar:2 Faktoren und der AV dar: Horizontale Achse… 1.FaktorHorizontale Achse… 1.Faktorhier: schulhier: schul Separate Linien… 2.FaktorSeparate Linien… 2.Faktorhier: geschlhier: geschl Separate Diagramme… 3.FaktorSeparate Diagramme… 3.Faktor Post-Hoc… wie bei ANOVAPost-Hoc… wie bei ANOVA (Speichern… Hier kann man festlegen, dass bestimmte (Speichern… Hier kann man festlegen, dass bestimmte
Werte als neue Variablen gespeichert werden können)Werte als neue Variablen gespeichert werden können)
AnalysierenAnalysierenAllgemeines lineares Allgemeines lineares ModellModellUnivariatUnivariat
Optionen: Optionen: Geschätzte Randmittel:Geschätzte Randmittel: Mittelwerte anzeigen für… Auswahl der Faktoren und –Mittelwerte anzeigen für… Auswahl der Faktoren und – kombinationen für Ausgabe der Mittelwertekombinationen für Ausgabe der Mittelwertehier: (Insgesamt)hier: (Insgesamt) Haupteffekte vergleichen UND Anpassung desHaupteffekte vergleichen UND Anpassung des Konfidenzintervalls… Auswahl von Post-Hoc-TestsKonfidenzintervalls… Auswahl von Post-Hoc-Tests Anzeigen:Anzeigen: Deskriptive Statistik… für jede FaktorstufenkominationDeskriptive Statistik… für jede Faktorstufenkomination Schätzer der Effektgröße… partielle Eta-Werte für erklärte Schätzer der Effektgröße… partielle Eta-Werte für erklärte Varianz für jeden Faktor, Interaktion und KovariateVarianz für jeden Faktor, Interaktion und Kovariatehier: beide ankreuzenhier: beide ankreuzen Beobachtete Schärfe… Wahrscheinlichkeit einen tatsächlich Beobachtete Schärfe… Wahrscheinlichkeit einen tatsächlich vorhandenen Effekt auch zu entdeckenvorhandenen Effekt auch zu entdecken etc.etc. Signifikanzniveau Signifikanzniveau
2-faktorielle Varianzanalyse2-faktorielle Varianzanalyse
Zwischensubjektfaktoren
Hauptschule
74
Mittelschule
33
Fachh/Abi 35
MAENNLICH
80
WEIBLICH 62
2
3
4
Schulbildungumkodiert
1
2
GESCHLECHT,BEFRAGTE<R>
Wertelabel N
Gesamtmittelwert
Abhängige Variable: BEFR.: MONATLICHESNETTOEINKOMMEN
2142,756a 94,009 1956,836 2328,676Mittelwert
Standardfehler Untergrenze Obergrenze
95% Konfidenzintervall
Die Kovariaten im Modell werden anhand derfolgenden Werte berechnet: ALTER,BEFRAGTE<R> = 49,63.
a.
2-faktorielle Varianzanalyse2-faktorielle Varianzanalyse
Deskriptive Statistiken
Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN
2214,63 1130,896 40
1328,15 710,437 34
1807,32 1053,217 74
2895,24 1142,137 21
1897,92 633,394 12
2532,58 1091,131 33
2675,00 1321,606 19
1806,13 870,318 16
2277,80 1204,875 35
2502,63 1204,036 80
1561,77 774,572 62
2091,83 1136,262 142
GESCHLECHT,BEFRAGTE<R>MAENNLICH
WEIBLICH
Gesamt
MAENNLICH
WEIBLICH
Gesamt
MAENNLICH
WEIBLICH
Gesamt
MAENNLICH
WEIBLICH
Gesamt
Schulbildung umkodiertHauptschule
Mittelschule
Fachh/Abi
Gesamt
MittelwertStandardabweichung N
2-faktorielle Varianzanalyse2-faktorielle VarianzanalyseTests der Zwischensubjekteffekte
Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN
42424611,068a 6 7070768,5 6,837 ,000 ,233
63559012,059 1 63559012 61,456 ,000 ,313
218591,240 1 218591,24 ,211 ,646 ,002
9909843,044 2 4954921,5 4,791 ,010 ,066
25432596,662 1 25432597 24,591 ,000 ,154
91478,764 2 45739,382 ,044 ,957 ,001
139619196,9 135 1034216,3
803401284,0 142
182043807,9 141
QuelleKorrigiertes Modell
Konstanter Term
alt
schul2
geschl
schul2 * geschl
Fehler
Gesamt
KorrigierteGesamtvariation
Quadratsumme vom Typ III df
Mittel derQuadrate F Signifikanz
PartiellesEta-Quadrat
R-Quadrat = ,233 (korrigiertes R-Quadrat = ,199)a.
Signifikanz>0,05Keine signifikante Interaktion Prüfung der Signifikanz der Haupteffekte: Geschlecht und Schulbildung haben signifikante Wirkung, weil Signifikanz<0,05; Kovariate Alter hat keine signifikante Wirkung, weil Sig. >0,05
(korrigiertes) R2=0,199 Modell erklärt ca. 20% der Gesamtvarianz: davon erklärt die Schulbildung ca. 7% und das Geschlecht ca. 15% der VarianzGeschlecht hat stärkere Wirkung als Schulbildung
2-faktorielle Varianzanalyse2-faktorielle Varianzanalyse
Tests der Zwischensubjekteffekte
Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN
42424611,068a 6 7070768,5 6,837 ,000 ,233
63559012,059 1 63559012 61,456 ,000 ,313
218591,240 1 218591,24 ,211 ,646 ,002
9909843,044 2 4954921,5 4,791 ,010 ,066
25432596,662 1 25432597 24,591 ,000 ,154
91478,764 2 45739,382 ,044 ,957 ,001
139619196,9 135 1034216,3
803401284,0 142
182043807,9 141
QuelleKorrigiertes Modell
Konstanter Term
alt
schul2
geschl
schul2 * geschl
Fehler
Gesamt
KorrigierteGesamtvariation
Quadratsumme vom Typ III df
Mittel derQuadrate F Signifikanz
PartiellesEta-Quadrat
R-Quadrat = ,233 (korrigiertes R-Quadrat = ,199)a.
2-faktorielle Varianzanalyse-2-faktorielle Varianzanalyse-DiagrammauswertungDiagrammauswertung
Separate Linien:Separate Linien: Wenn Zeilenvariable keinen Einfluss besitzt, verläuft sie parallel zur Wenn Zeilenvariable keinen Einfluss besitzt, verläuft sie parallel zur
x-Achsex-Achse Besitzt sie Einfluss, steigt oder fällt sieBesitzt sie Einfluss, steigt oder fällt siehier: Einfluss des Geschlechts auf Einkommenhier: Einfluss des Geschlechts auf Einkommen Wenn sie Einfluss hat, kann sie in verschiedenen Abschnitten Wenn sie Einfluss hat, kann sie in verschiedenen Abschnitten
unterschiedlich verlaufen, aber nicht parallelunterschiedlich verlaufen, aber nicht parallelHorizontale Achse:Horizontale Achse: Wenn Spaltenvariable keinen Einfluss besitzt, fallen die einzelnen Wenn Spaltenvariable keinen Einfluss besitzt, fallen die einzelnen
Linien zusammenLinien zusammen Wenn sie Einfluss hat: Abstand zwischen den LinienWenn sie Einfluss hat: Abstand zwischen den Linienhier: Einfluss des Geschlechts auf Einkommen vorhandenhier: Einfluss des Geschlechts auf Einkommen vorhanden Wenn Interaktion vorliegt, verlaufen Linien zumindest in Bereichen Wenn Interaktion vorliegt, verlaufen Linien zumindest in Bereichen
nicht parallelnicht parallelhier: Linien verlaufen im Bereich Fachhochschule/Abi nicht mehr hier: Linien verlaufen im Bereich Fachhochschule/Abi nicht mehr
parallelparallelleichte Interaktionleichte Interaktion Wenn keine Interaktion vorliegt, verlaufen die Linien parallel Wenn keine Interaktion vorliegt, verlaufen die Linien parallel
Konstanz des AbstandsKonstanz des Abstands
AufgabenAufgabenFür diese Aufgaben wird der Datensatz Master_FP_2006 benötigt. Für diese Aufgaben wird der Datensatz Master_FP_2006 benötigt. Es geht um die Variablen studfach(1.abgeschlossenes Studienfach) und Es geht um die Variablen studfach(1.abgeschlossenes Studienfach) und
f51aufst(Berufserfolg bedeutet gute Aufstiegschancen zu haben). Es f51aufst(Berufserfolg bedeutet gute Aufstiegschancen zu haben). Es interessiert hier, ob das Studienfach beeinflusst, wie sehr der Aussage interessiert hier, ob das Studienfach beeinflusst, wie sehr der Aussage (nicht) zugestimmt wird, dass „Beruflicher Erfolg ist … gute (nicht) zugestimmt wird, dass „Beruflicher Erfolg ist … gute Aufstiegschancen zu haben.“ Aufstiegschancen zu haben.“
a)a) Vergleicht zuerst die Mittelwerte der Gruppen der Variable studfach Vergleicht zuerst die Mittelwerte der Gruppen der Variable studfach untereinander und mit dem Gesamtmittelwert der Variable studfach!untereinander und mit dem Gesamtmittelwert der Variable studfach!
b)b) Nun soll herausgefunden werden, ob sich die Mittelwerte von f51einko Nun soll herausgefunden werden, ob sich die Mittelwerte von f51einko signifikant unterscheiden, je nachdem welches Studienfach studiert signifikant unterscheiden, je nachdem welches Studienfach studiert wurde. Welchen Test könnt ihr dazu verwenden? wurde. Welchen Test könnt ihr dazu verwenden?
c)c) Führt den Test durch! Was ist das Ergebnis?Führt den Test durch! Was ist das Ergebnis?d)d) Welchen Test müsste man verwenden, wenn man herausfinden will, ob Welchen Test müsste man verwenden, wenn man herausfinden will, ob
es signifikante Mittelwertsdifferenzen bezüglich f70gesch(Haben Sie es signifikante Mittelwertsdifferenzen bezüglich f70gesch(Haben Sie Geschwister?) bzgl. f51aufst gibt?Geschwister?) bzgl. f51aufst gibt?
e)e) Führt den Test durch! Was ist das Ergebnis?Führt den Test durch! Was ist das Ergebnis?
LiteraturempfehlungenLiteraturempfehlungen
CD-Rom: CD-Rom: Fröhlich, Romy/Wutz, Gertraud, Rossmann, Raphael(2005): Fröhlich, Romy/Wutz, Gertraud, Rossmann, Raphael(2005):
Einführung in die sozialwissenschaftliche Datenanalyse, Ein Einführung in die sozialwissenschaftliche Datenanalyse, Ein multimediales Selbstlernprogramm. Wiesbaden: VS Verlag multimediales Selbstlernprogramm. Wiesbaden: VS Verlag für Sozialwissenschaften/GWV Fachverlage GmbH.für Sozialwissenschaften/GWV Fachverlage GmbH.
Lehrbuch:Lehrbuch: Janssen, Jürgen/Laatz, Wilfried(2005): Statistische Janssen, Jürgen/Laatz, Wilfried(2005): Statistische
Datenanalyse mit SPSS für Windows. Berlin, Heidelberg: Datenanalyse mit SPSS für Windows. Berlin, Heidelberg: Springer-Verlag.Springer-Verlag.
SPSS:SPSS: Ergebnis-Assistent bei Tabellen (in Englisch)Ergebnis-Assistent bei Tabellen (in Englisch) Hilfe-Taste auf den Fenstern (erklärt Vorgang und seine Hilfe-Taste auf den Fenstern (erklärt Vorgang und seine
Bedeutung)Bedeutung)
QuellenQuellen
Backhaus, Klaus/Erichson, Bernd/Plinke, Wulff/Weiber, Rolf(2006): Backhaus, Klaus/Erichson, Bernd/Plinke, Wulff/Weiber, Rolf(2006): Multivariate Analysemethoden. Berlin/Heidelberg: Springer-Verlag.Multivariate Analysemethoden. Berlin/Heidelberg: Springer-Verlag.
Bellgardt, Egon(2004): Statistik mit SPSS. München: Verlag Franz Bellgardt, Egon(2004): Statistik mit SPSS. München: Verlag Franz Vahlen GmbH.Vahlen GmbH.
Fahrmeir, Ludwig ed.al.(2005): Arbeitsbuch Statistik. Fahrmeir, Ludwig ed.al.(2005): Arbeitsbuch Statistik. Berlin/Heidelberg: Springer-Verlag.Berlin/Heidelberg: Springer-Verlag.
Fröhlich, Romy/Wutz, Gertraud, Rossmann, Raphael(2005): Fröhlich, Romy/Wutz, Gertraud, Rossmann, Raphael(2005): Einführung in die sozialwissenschaftliche Datenanalyse, Ein Einführung in die sozialwissenschaftliche Datenanalyse, Ein multimediales Selbstlernprogramm. Wiesbaden: VS Verlag für multimediales Selbstlernprogramm. Wiesbaden: VS Verlag für Sozialwissenschaften/GWV Fachverlage GmbH.Sozialwissenschaften/GWV Fachverlage GmbH.
Kähler, Wolf-Michael(2006): Statistische Datenanalyse. Wiesbaden: Kähler, Wolf-Michael(2006): Statistische Datenanalyse. Wiesbaden: Friedr. Vieweg & Sohn Verlag/GWV Fachverlage GmbH.Friedr. Vieweg & Sohn Verlag/GWV Fachverlage GmbH.
Janssen, Jürgen/Laatz, Wilfried(2003): Statistische Datenanalyse Janssen, Jürgen/Laatz, Wilfried(2003): Statistische Datenanalyse mit SPSS für Windows. Berlin, Heidelberg: Springer-Verlag.mit SPSS für Windows. Berlin, Heidelberg: Springer-Verlag.
Recommended