73
Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Embed Size (px)

Citation preview

Page 1: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analysekategorialer

Variablen

Katrin OehlkersHelke Neuendorff

Tobias Schiller

Page 2: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Gliederung

1. Einführung2. Das lineare Logit-Modell3. Anwendungsbeispiel4. Zum loglinearen Modell

Page 3: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

1.Einführung

Page 4: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Skalenniveaus

Kategoriale Variablen(topologisch / qualitativ)

Metrische Variablen(quantitativ)

Nominal Ordinal Intervall RationalRelationen = ≠ = ≠

< >= ≠< >+ -

= ≠< >+ -x /

Beispiele FamilienstandGeschlecht

SchulnotenRangfolgen

Temperaturin °C

EinkommenGröße

Ta . 1: b Variablentyp en na chSkalenniveaus (na chROSNER 2001, S. 10)

Page 5: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Skalenniveaus

Kategoriale Variablen(topologisch / qualitativ)

Metrische Variablen(quantitativ)

Nominal Ordinal Intervall RationalRelationen = ≠ = ≠

< >= ≠< >+ -

= ≠< >+ -x /

Beispiele FamilienstandGeschlecht

SchulnotenRangfolgen

Temperaturin °C

EinkommenGröße

Ta . 1: b Variablentyp en na chSkalenniveaus (na chROSNER 2001, S. 10)

Page 6: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Skalenniveaus

Kategoriale Variablen(topologisch / qualitativ)

Metrische Variablen(quantitativ)

Nominal Ordinal Intervall RationalRelationen = ≠ = ≠

< >= ≠< >+ -

= ≠< >+ -x /

Beispiele FamilienstandGeschlecht

SchulnotenRangfolgen

Temperaturin °C

EinkommenGröße

Ta . 1: b Variablentyp en na chSkalenniveaus (na chROSNER 2001, S. 10)

Page 7: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Skalenniveaus

Kategoriale Variablen(topologisch / qualitativ)

Metrische Variablen(quantitativ)

Nominal Ordinal Intervall RationalRelationen = ≠ = ≠

< >= ≠< >+ -

= ≠< >+ -x /

Beispiele FamilienstandGeschlecht

SchulnotenRangfolgen

Temperaturin °C

EinkommenGröße

Ta . 1: b Variablentyp en na chSkalenniveaus (na chROSNER 2001, S. 10)

Page 8: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Skalenniveaus

Kategoriale Variablen(topologisch / qualitativ)

Metrische Variablen(quantitativ)

Nominal Ordinal Intervall RationalRelationen = ≠ = ≠

< >= ≠< >+ -

= ≠< >+ -x /

Beispiele FamilienstandGeschlecht

SchulnotenRangfolgen

Temperaturin °C

EinkommenGröße

Ta . 1: b Variablentyp en na chSkalenniveaus (na chROSNER 2001, S. 10)

Page 9: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Skalenniveaus

Kategoriale Variablen(topologisch / qualitativ)

Metrische Variablen(quantitativ)

Nominal Ordinal Intervall RationalRelationen = ≠ = ≠

< >= ≠< >+ -

= ≠< >+ -x /

Beispiele FamilienstandGeschlecht

SchulnotenRangfolgen

Temperaturin °C

EinkommenGröße

(nac h ROSNER 2001, S. 10)

Page 10: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Skalenniveaus

Kategoriale Variablen(topologisch / qualitativ)

Metrische Variablen(quantitativ)

Nominal Ordinal Intervall RationalRelationen = ≠ = ≠

< >= ≠< >+ -

= ≠< >+ -x /

Beispiele FamilienstandGeschlecht

SchulnotenRangfolgen

Temperaturin °C

EinkommenGröße

(nac h ROSNER 2001, S. 10)

Page 11: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Skalenniveaus

Kategoriale Variablen(topologisch / qualitativ)

Metrische Variablen(quantitativ)

Nominal Ordinal Intervall RationalRelationen = ≠ = ≠

< >= ≠< >+ -

= ≠< >+ -x /

Beispiele FamilienstandGeschlecht

SchulnotenRangfolgen

Temperaturin °C

EinkommenGröße

(nac h ROSNER 2001, S. 10)

Page 12: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Skalenniveaus

Kategoriale Variablen(topologisch / qualitativ)

Metrische Variablen(quantitativ)

Nominal Ordinal Intervall RationalRelationen = ≠ = ≠

< >= ≠< >+ -

= ≠< >+ -x /

Beispiele FamilienstandGeschlecht

SchulnotenRangfolgen

Temperaturin °C

EinkommenGröße

(nac h ROSNER 2001, S. 10)

Page 13: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Skalenniveaus

Kategoriale Variablen(topologisch / qualitativ)

Metrische Variablen(quantitativ)

Nominal Ordinal Intervall RationalRelationen = ≠ = ≠

< >= ≠< >+ -

= ≠< >+ -x /

Beispiele FamilienstandGeschlecht

SchulnotenRangfolgen

Temperaturin °C

EinkommenGröße

(nac h ROSNER 2001, S. 10)

Page 14: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Merkmale kategorialer Variablen:• dichotome Variablen

• polytome Variablen

Zwei Ausprägungenz.B. Variable „Geschlecht“ = männlich/weiblich

Mehrere Ausprägungenz.B. Variable „Verkehrsmittel“ = Bus/Bahn/Auto/Fahrrad/Fußgänger

• können nur endlich viele Werte annehmen

Page 15: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Typen statistischer Zusammenhänge:

Page 16: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Typen statistischer Zusammenhänge:

Abhängige Unabhängige VariablenVariablen alle metrisch gemischt kategorial keine

metrischMultiple

Regressions-analyse

MultipleRegressions-

analyse

Varianz-analyse

Korrelations-/Faktorenanalyse

kategorial Logit-Modell Logit-ModellLogit-Modell &

LoglinearesModell

LoglinearesModell

Page 17: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Typen statistischer Zusammenhänge:

Abhängige Unabhängige VariablenVariablen alle metrisch gemischt kategorial keine

metrischMultiple

Regressions-analyse

MultipleRegressions-

analyse

Varianz-analyse

Korrelations-/Faktorenanalyse

kategorial Logit-Modell Logit-ModellLogit-Modell &

LoglinearesModell

LoglinearesModell

Page 18: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Typen statistischer Zusammenhänge:

Abhängige Unabhängige VariablenVariablen alle metrisch gemischt kategorial keine

metrischMultiple

Regressions-analyse

MultipleRegressions-

analyse

Varianz-analyse

Korrelations-/Faktorenanalyse

kategorial Logit-Modell Logit-ModellLogit-Modell &

LoglinearesModell

LoglinearesModell

Page 19: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Typen statistischer Zusammenhänge:

Abhängige Unabhängige VariablenVariablen alle metrisch gemischt kategorial keine

metrischMultiple

Regressions-analyse

MultipleRegressions-

analyse

Varianz-analyse

Korrelations-/Faktorenanalyse

kategorial Logit-Modell Logit-ModellLogit-Modell &

LoglinearesModell

LoglinearesModell

Page 20: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Typen statistischer Zusammenhänge:

Abhängige Unabhängige VariablenVariablen alle metrisch gemischt kategorial keine

metrischMultiple

Regressions-analyse

MultipleRegressions-

analyse

Varianz-analyse

Korrelations-/Faktorenanalyse

kategorial Logit-Modell Logit-ModellLogit-Modell &

LoglinearesModell

LoglinearesModell

Page 21: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Typen statistischer Zusammenhänge:

Abhängige Unabhängige VariablenVariablen alle metrisch gemischt kategorial keine

metrischMultiple

Regressions-analyse

MultipleRegressions-

analyse

Varianz-analyse

Korrelations-/Faktorenanalyse

kategorial Logit-Modell Logit-ModellLogit-Modell &

LoglinearesModell

LoglinearesModell

Page 22: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Typen statistischer Zusammenhänge:

Abhängige Unabhängige VariablenVariablen alle metrisch gemischt kategorial keine

metrischMultiple

Regressions-analyse

MultipleRegressions-

analyse

Varianz-analyse

Korrelations-/Faktorenanalyse

kategorial Logit-Modell Logit-ModellLogit-Modell &

LoglinearesModell

LoglinearesModell

Page 23: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Typen statistischer Zusammenhänge:

Abhängige Unabhängige VariablenVariablen alle metrisch gemischt kategorial keine

metrischMultiple

Regressions-analyse

MultipleRegressions-

analyse

Varianz-analyse

Korrelations-/Faktorenanalyse

kategorial Logit-Modell Logit-ModellLogit-Modell &

LoglinearesModell

LoglinearesModell

Page 24: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Typen statistischer Zusammenhänge:

Abhängige Unabhängige VariablenVariablen alle metrisch gemischt kategorial keine

metrischMultiple

Regressions-analyse

MultipleRegressions-

analyse

Varianz-analyse

Korrelations-/Faktorenanalyse

kategorial Logit-Modell Logit-ModellLogit-Modell &

LoglinearesModell

LoglinearesModell

Page 25: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

2. Das lineare Logit-Modell

Y =0 falls A < 0

1 falls A ≥ 0

⎧ ⎨ ⎩

(A als Ausprägungender unabhängigen Variable Y)

Page 26: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

2.1 Lineare Regressionsgleichung

yj = α + βxj

Page 27: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

(nach Rosner 2001: S. 59)

Lineare Regressionsgerade

Page 28: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Lineare Regressionsgerade

(nach Rosner 2001: S. 59)

Page 29: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Lineare Regressionsgerade

(nach Rosner 2001: S. 59)

Page 30: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Lineare Regression

Die Regressionsgerade ist nurin einem beschränkten Bereichsinnvoll interpretierbar.

Page 31: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

2.2 LinearesWahrscheinlichkeitsmodell

p1j =

0 für a + bxj < 0

ˆ y j für 0 ≤ a + bxj ≤ 1

1 für a + bxj >1

⎨ ⎪

⎩ ⎪

p1j = Wahrscheinlichkeit mit der Y fürX = xj den Wert 1 annimmt.

p0j = 1 - p1j = Wahrscheinlichkeit mit derY für X = xj den Wert 0 annimmt.

Page 32: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Lineares Wahrscheinlichkeitsmodell

(nach Rosner 2001: S. 59)

Page 33: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Lineares Wahrscheinlichkeitsmodell

(nach Rosner 2001: S. 59)

Page 34: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Nachteile:

1. Schätzung in der Nähe der Extremwerte ungenau

2. Nicht erweiterbar auf den Fall, dass Y eine polytome Variable ist

3. Erfahrungsgemäß eher s-förmiger Kurvenverlauf

Page 35: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

2.3 Logistisches Modell

y j = p1 j = α + βx j

Page 36: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

2.3 Logistisches Modell

y j = p1 j = α + βx j

Page 37: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

2.3 Logistisches Modell

p1 j =eα +βx j

1+1

eα +βx j

• Geht xj gegen oo, geht p1j gegen 1• Geht xj gegen –oo, geht p1j gegen 0

p1j kann nur noch Wertezwischen 1 und 0 annehmen!

Page 38: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Logistisches Modell

(nach Rosner 2001: S. 60)

Page 39: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Umformung:

p0 j =1− p1 j =1−eα +βx j

1+ e− α +βx j( )

=1+ eα +βx j − eα +βx j

1+ e− α +βx j( )=

1

1+ e− α +βx j( )

Page 40: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Umformung:

p0 j =1− p1 j =1−eα +βx j

1+ e− α +βx j( )

=1+ eα +βx j − eα +βx j

1+ e− α +βx j( )=

1

1+ e− α +βx j( )

Page 41: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Umformung:

p0 j =1− p1 j =1−eα +βx j

1+ e− α +βx j( )

=1+ eα +βx j − eα +βx j

1+ e− α +βx j( )=

1

1+ e− α +βx j( )

Page 42: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Umformung:

p0 j =1− p1 j =1−eα +βx j

1+ e− α +βx j( )

=1+ eα +βx j − eα +βx j

1+ e− α +βx j( )=

1

1+ e− α +βx j( )

Page 43: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Umformung:

p0 j =1− p1 j =1−eα +βx j

1+ e− α +βx j( )

=1+ eα +βx j − eα +βx j

1+ e− α +βx j( )=

1

1+ e− α +βx j( )

Page 44: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

p =1

1+1

e(α +βx )

⋅(1+1

e(α +βx ))

p +p

e(α +βx )=1 −p

p

e(α +βx )=1− p ⋅e(α +βx )

Page 45: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

p =1

1+1

e(α +βx )

⋅(1+1

e(α +βx ))

p +p

e(α +βx )=1 −p

p

e(α +βx )=1− p ⋅e(α +βx )

Page 46: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

p =1

1+1

e(α +βx )

⋅(1+1

e(α +βx ))

p +p

e(α +βx )=1 −p

p

e(α +βx )=1− p ⋅e(α +βx )

Page 47: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

p = (1− p) ⋅(eα +βx ) ⋅1

1− p

p

1− p= eα +βx ln

lnp

1− p= α + βx

Page 48: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

p = (1− p) ⋅(eα +βx ) ⋅1

1− p

p

1− p= eα +βx ln

lnp

1− p= α + βx

Page 49: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

p = (1− p) ⋅(eα +βx ) ⋅1

1− p

p

1− p= eα +βx ln

lnp

1− p= α + βx

Page 50: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

p = (1− p) ⋅(eα +βx ) ⋅1

1− p

p

1− p= eα +βx ln

lnp

1− p= α + βx

Logit

Page 51: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Logit-Transformation

lnp

1− p

L = α + βx

Page 52: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

3. Anwendungsbeispiel: Pendlerverhalten von Angestellten

STP:12 Angestellte

„Gelangen Sie motorisiert oderzu Fuß an Ihren Arbeitsplatz?“

Page 53: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Unabhängige Variable (X):Entfernung zum Arbeitsplatz• in kmAbhängige Variable (Y):Wahl des Verkehrsmittels• „zu Fuß“: 0• „motorisiert“: 1

Fragestellung:

Welchen Einfluss übt die Entfernungzum Arbeitsplatz auf dieWahl des Verkehrsmittels aus?

Page 54: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

K 1 2 3 4 5 6 7 8 9 10 11 12

Entfernung (km)

Verkehrsmittels

x´k

y´k

0,5 0,7 1,0 1,3

0 0 1 0

1,5 2,0 2,2 2,3

0 1 1 0

2,7 3,0 3,2 3,4

1 0 1 1

„km – Gruppen“ i 1 2 3Anteil derAusprägungeni. d. jew. Km -Gruppe

xi

pi

1

1/4

2

2/4

3

3/4

Ergebnistabelle:

Page 55: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

K 1 2 3 4 5 6 7 8 9 10 11 12Entfernung (km)

Verkehrsmittels:

x´k

y´k

0,5 0,7 1,0 1,3

0 0 1 0

1,5 2,0 2,2 2,3

0 1 1 0

2,7 3,0 3,2 3,4

1 0 1 1

(nach Hartung 1995)

Page 56: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Lineare Regression:

y = α + βx

y = 0,0179 + 0,243x

(nach Hartung 1995)

Page 57: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Logit-Modell:

p =1

1+1

e(α +βx )

lnp

1− p= α + βx

Für die Ausprägungen p=0 und p=1gibt es keine Lösung.Deshalb Berechnung der Logits!

Page 58: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Berechnung der Logits:

gilg t = ln

ˆ p i1− ˆ p i

g1lg t = ln

0,25

1− 0,25

= ln1

3= −1,0986

g2lg t = 0

g3lg t =1,0986

Page 59: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

K 1 2 3 4 5 6 7 8 9 10 11 12Entfernung z.Arbeitsplatz inkm:Wahl desVerkehrsmittels:

x´k

y´k

0,5 0,7 1,0 1,3

0 0 1 0

1,5 2,0 2,2 2,3

0 1 1 0

2,7 3,0 3,2 3,4

1 0 1 1

„km – Gruppen“ i 1 2 3Anteil derAusprägungeni. d. jew. Km -Gruppe

xi

pi

1

1/4

2

2/4

3

3/4

Berechnung der Logits:

gilg t = ln

ˆ p i1− ˆ p i

g1lg t = ln

0,25

1− 0,25

= ln1

3= −1,0986

g2lg t = 0

g3lg t =1,0986

Page 60: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Berechnung der Logits:

gilg t = ln

ˆ p i1− ˆ p i

g1lg t = ln

0,25

1− 0,25

= ln1

3= −1,0986

g2lg t = 0

g3lg t =1,0986

Page 61: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Berechnung der Logits:

gilg t = ln

ˆ p i1− ˆ p i

g1lg t = ln

0,25

1− 0,25

= ln1

3= −1,0986

g2lg t = 0

g3lg t =1,0986

Page 62: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Regressionsgerade der Logits

(1/-1,0986)

(3/1,0986)

(2/0)

(nach Hartung 1995)

Page 63: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Berechnung derRegressionsgerade der Logits

y = b + ax

a =y1 − y2

x1 − x2

=1,0986

b = y2 −y1 − y2

x1 − x2

⋅ x2 = −2,1972

ˆ g lg t = −2,1972 +1,0986 ⋅ x

Page 64: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Berechnung derRegressionsgerade der Logits

y = b + ax

a =y1 − y2

x1 − x2

=1,0986

b = y2 −y1 − y2

x1 − x2

⋅ x2 = −2,1972

ˆ g lg t = −2,1972 +1,0986 ⋅ x

Page 65: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Berechnung derRegressionsgerade der Logits

y = b + ax

a =y1 − y2

x1 − x2

=1,0986

b = y2 −y1 − y2

x1 − x2

⋅ x2 = −2,1972

ˆ g lg t = −2,1972 +1,0986 ⋅ x

Page 66: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Berechnung derRegressionsgerade der Logits

y = b + ax

a =y1 − y2

x1 − x2

=1,0986

b = y2 −y1 − y2

x1 − x2

⋅ x2 = −2,1972

ˆ g lg t = −2,1972 +1,0986 ⋅ x

Page 67: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Lösung:Ergebnisse einsetzen in Formel

des Logit-Modells

p =1

1+ e−(α +βx )

p =1

1+ e−(−2,1972+1,0986x )

Page 68: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Fragestellung:

Wieviele Pendler benutzen bei einerDistanz von 4km zum Arbeitsplatzein motorisiertes Verkehrsmittel?

p =1

1+ e−(−2,1972+1,0986⋅4 )

= 0,8999

90% benutzen ein Auto!

Page 69: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

4. Das Loglineare Modell

Abhängige Unabhängige VariablenVariablen alle metrisch gemischt kategorial keine

metrischMultiple

Regressions-analyse

MultipleRegressions-

analyse

Varianz-analyse

Korrelations-/Faktorenanalyse

kategorial Logit-Modell Logit-ModellLogit-Modell &

LoglinearesModell

LoglinearesModell

Page 70: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Stichworte zum loglinearen Modell

• bei mehr als zwei kategorialen Variablen

• Lösung mehrdimensionale Kontingenztabellen

• Fragestellung: Besteht überhaupt ein Zusammenhang zwischen Variablen? Wie stark ist dieser?

Page 71: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Zusammenhang von

• Binnenwanderungssaldo

• Verstädterungsgrad

• Arbeitsplatzentwicklung

Beispiel:

negativ / schwach positiv / stark

niedrig / hoch

negativ / positiv

Page 72: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Logit-Modell und Loglineares Modell

Logit-Modell etwa vergleichbar mit Regressionsanalyse

Loglineares Modell etwa vergleichbar mit Korrelationsanalyse

Page 73: Analyse kategorialer Variablen Katrin Oehlkers Helke Neuendorff Tobias Schiller

Analyse kategorialer Variablen Oehlkers • Neuendorff • Schiller

Ende.