Upload
burk-geffen
View
107
Download
4
Embed Size (px)
Citation preview
Institut für Arbeitsmarkt- und Berufsforschung
1
dgdg
LASER Workshop
Mehrebenenanalyse
Nürnberg, 30. Oktober 2008Uwe BlienPhan thi Hong Van
Methoden der MehrebenenanalyseZur Untersuchung der sozialen und ökonomischen
Einbindung von Subjekten und Organisationen
Institut für Arbeitsmarkt- und Berufsforschung
2
Gliederung
1. Einführung: Einige typische Fragestellungen der
Mehrebenenanalyse
2. Kapitel: Konzeptionelle Mehrebenenanalyse
3. Kapitel: Statistische Mehrebenenanalyse
4. Kapitel: Ein empirisches Beispiel
5. Fazit
Institut für Arbeitsmarkt- und Berufsforschung
3
Einführung: Einige typische Fragestellungen der Mehrebenenanalyse
Institut für Arbeitsmarkt- und Berufsforschung
4
1. Einführung: Einige typische Fragestellungen der Mehrebenenanalyse
• Wie hängt der Erfolg von Schülern in Leistungstests von eigenen Merkmalen und von solchen ihrer Klassen, Schulen und Nachbarschaften ab?
• Wie wird der Lohn von Arbeitskräften von der regionalen Arbeitslosenquote beeinflusst?
• Haben Kinderbetreuungseinrichtungen in der Nachbarschaft Einfluss auf die Erziehungsmotivation von Müttern?
Zur Untersuchung all dieser Fragestellungen sind Modellenotwendig, Modelle der Mehrebenenanalyse
Institut für Arbeitsmarkt- und Berufsforschung
5
Ausgangspunkt: Ein einfaches Regressionsmodell
0: Regressionskonstante, Achsenabschnitt, Intercept
1: Steigung der Regressionsgeraden, Slope
r: Fehlerterm
Das Modell spezifiziert einen Zusammenhang zwischen der
abhängigen und den unabhängigen Variablen und einen
Zufallsprozess für den Fehlerterm.
ijijij rXY 10
Institut für Arbeitsmarkt- und Berufsforschung
6
Hierarchie der Ebenen
Häufig sind die Beziehungen zwischen Individual- undKollektiveinheiten genestet, d. h. von hierarchischer Natur:
- Mütter leben in Familien in Gemeinden in Regionen- Arbeitskräfte arbeiten in Firmen in Gemeinden in Regionen- Schüler lernen in Klassen in Schulen in Bundesländern
Darüber hinaus gibt es soziale Kontexte, die keine Hierarchie bilden, sondern „kreuzklassifiziert“ sind:
- Schüler haben eine soziale Umgebung in einer Klasse und eine in ihrer Wohngegend, die sich teilweise überschneiden.
Institut für Arbeitsmarkt- und Berufsforschung
7
Typisierung von Mehrebenenansätzen
Konzeptionelle Ansätze Methodische Ansätze
Rational Choice Ansätze (i.e.S.)
Modelle mit zufälligen Effekten & Koeffizienten
Modelle mit fixen Effekten und
Interaktionstermen
Systemtheoretische Mehrebenenansätze
Verallgemeinerte individuelle Wahl
Institut für Arbeitsmarkt- und Berufsforschung
8
Konzeptionelle Mehrebenenanalyse
Institut für Arbeitsmarkt- und Berufsforschung
9
2. Kapitel: Konzeptionelle Mehrebenenanalyse
Von konzeptioneller Mehrebenenanalyse wird gesprochen, wenn in einer Forschungsfragestellung Individuen mit größeren sozialen Einheiten verbunden werden, die ihrerseits wieder in hierarchischen oder überkreuzten Bezie-hungen stehen können.
Derartige Fragestellungen betreffen den Kern der soziologi-schen und ökonomischen Analyse (Stichworte „Individuum und Gesellschaft“, „Handlung und Struktur“, „Akteur und Kontext“, „Mikrofundierung der Makroökonomie“ etc.).
Institut für Arbeitsmarkt- und Berufsforschung
10
Mehrebenenanalyse im Rational Choice Ansatz oder in vergleichbaren Arbeiten
Mikrofundierung von gesellschaftlichen Phänomenen
Individueller „Umweg“ zur Erklärung von Makrophänomenen
Schema nach McClelland (1961), Coleman (1990), Esser (1988/1993):
Makrobedingungen Makroresultat
Individuelle Akteure Individuelle Handlungen
Individuelle Akteure
Institut für Arbeitsmarkt- und Berufsforschung
11
Mehrebenenanalyse im Ansatz verallgemeinerter individueller Wahl
Zusätzliche Makrofundierung individuellen Handelns
Bedingungen, Sozialisation etc.
Nicht nur Bedingungen beeinflussen das individuelle Kallkül, auch die Präferenzen sind endogen:
Makroresultat
Individuelle Akteure Individuelle Handlungen
Individuelle Akteure
Institut für Arbeitsmarkt- und Berufsforschung
12
Systemtheoretische Mehrebenenanalyse
Systeme handeln, nicht Individuen (hier nicht weiter verfolgt)
Z. B. Huinink (1989)
Beliebige Einflüsse zwischen den Ebenen zulässig
Makrobedingungen Makroresultat
Individueller Akteur Individuelle Handlung
Institut für Arbeitsmarkt- und Berufsforschung
13
Statistische Mehrebenenanalyse
Institut für Arbeitsmarkt- und Berufsforschung
14
Grundlegende Typologie von Mehrebenenmodellen
Modellart Einsatzbereich bei Mehrebenenproblemen
Pooled Regression Nur zu empfehlen, wenn Gruppenstruktur keine Rolle spielt
Zufällige Effekte (“Mehrebenenmodelle“)
Keine Korrelation zwischen exogenen Variablen und Störtermen
Gruppeneinheiten Zufallsstichprobe
Fixe Effekte Wenn keine Multikollinearität zwischen Gruppenvariablen mit fixen Effekten
3. Kapitel: Statistische Mehrebenenanalyse
Institut für Arbeitsmarkt- und Berufsforschung
15
Wozu Mehrebenenanalyse?
• Verbindung von Individual- und Aggregatdaten auf der Ebene der Individuen (oder „kleiner“ Aggregate): Aggregatmerkmale werden zu Individualdaten dazugespielt
• Schätzen von Regressionsmodellen• Interpretation der Resultate für Individual- und Aggregat-
variablen
• Wo ist das Problem?
Institut für Arbeitsmarkt- und Berufsforschung
16
Ein erster Hinweis auf ein Problem kann den unterschiedlichen Fallzahlen auf den Ebenen entnommen werden
• Aggregatebene mit viel weniger Beobachtungen als Individualebene
• Wird in der Schätzung von Modellen nirgendwo berücksichtigt• Signifikanztests basieren nicht auf (z. B.) 326 Kreisen West,
sondern auf den Beobachtungen auf der Individualebene
Institut für Arbeitsmarkt- und Berufsforschung
17
Statistische Mehrebenenmodelle sind notwendig, wenn Untersuchungseinheiten systematisch von den gleichen unbeobachteten Einflüssen betroffen sind
Moulton (1990)fand in einer Regression mit dem Lohn als abhängiger Variablen „signifikante“ Effekte von exogenen Regionalvariablen, die keine sinnvolle Interpretation aufweisen (z. B. Seengrößen oder Zufallszahlen)
Korrelieren die Störgrößen von Beobachtungen innerhalb der übergeordneten Einheiten, z. B. innerhalb von Regionen, werden die Koeffizienten ineffizient und ihre Standardfehler verzerrt geschätzt.
Institut für Arbeitsmarkt- und Berufsforschung
18
Regressionsanalyse mit zufällig variierender Steigung (slope) der Regressionsgeraden (II)
Schulleistung
Index soziale Herkunft
Regressionsgeraden
x x x x x x x x x
x x x x x x x x x
x x x x x x x x x x x x
x x x x x x x x x
x x x x x x
x x x x x x x x x x x x x
x x x x x x x x x
x x x x x
Modelle mit variierendenSlopes werdenhier nicht weiter verfolgt!
Institut für Arbeitsmarkt- und Berufsforschung
19
Einige Annahmen, die bei Mehrebenenmodellen mit zufälligen Effekten oder Koeffizienten notwendig sind
- Spezifikation der funktionalen Form des Modells- Spezifikation der Verteilung der Zufallsvariablen - Unkorreliertheit der Störterme zwischen den Ebenen- Unkorreliertheit der exogenen Variablen von den Störter- men auf den verschiedenen Ebenen (kritische Annahme)
Wenn die letzte Annahme verletzt ist, werden die Modellpara-meter verzerrt geschätzt. In den Sozialwissenschaften und dersie beratenden Statistik wird dies im allgemeinen als nicht beson-ders problematisch eingestuft, anders in der Ökonometrie.
Institut für Arbeitsmarkt- und Berufsforschung
20
Modelle mit fixen oder mit zufälligen Effekten? (1)
Für zufällige Effekte spricht:- Elementareinheiten den Einheiten auf höheren Ebenen zufällig zugeordnet- Einheiten auf höheren Ebenen Zufallsauswahl- E. auf höheren Ebenen „austauschbar“, gegeben X- E. auf höheren Ebenen „klein“ (< 50 Elementareinheiten)- Effekte von Aggregatvariablen wichtig
ijjijY 2i1ij βXβX0
Institut für Arbeitsmarkt- und Berufsforschung
21
Modelle mit fixen oder mit zufälligen Effekten? (2)
Für fixe Effekte spricht:- Elementareinheiten den Einheiten auf höheren Ebenen nicht zufällig zugeordnet- Einheiten auf höheren Ebenen mit klarer Identität- Größe der fixen Effekte wichtig- Keine Aggregatvariablen relevant (diese sind in der Grundform des Modells multikollinear mit den fixen Effekten)- Erklärende Variablen mit fixen Effekten korreliert
ijjijY 1ijβX0
Institut für Arbeitsmarkt- und Berufsforschung
22
Modelle mit fixen oder mit zufälligen Effekten? (3)
Problem: Fixe und zufällige Effekte führen im Zweifelsfall zu unterschiedlichen Ergebnissen, welches Modell ist „richtig“?Außerdem: Gibt es eine Möglichkeit, die jeweils zu Grunde gelegten Annahmen zu überprüfen?
Institut für Arbeitsmarkt- und Berufsforschung
23
Hausman (1978) Spezifikationstest zum Test Random versus Fixed (1)
- Random-Effects Schätzer effizient und konsistent, wenn Unkorre-
liertheitsannahme (etc.) zutreffend
- Fixed-Effects Schätzer nicht effizient, aber konsistent auch bei
Korrelation zwischen X und dem Störterm auf Aggregatebene
- Unterschiede bei Zutreffen der U.annahme nur zufällig
- Vergleich der Vektoren der geschätzten Koeffizienten zwischen
dem Random und dem Fixed Effects Modell im Hausman-Test
- Wenn signifikanter Unterschied, Unkorreliertheitshypo. abgelehnt
Institut für Arbeitsmarkt- und Berufsforschung
24
Hausman (1978) Spezifikationstest zum Test Random versus Fixed (2)
- Test, ob der Wahrscheinlichkeitslimes der Differenz von FE und RE-Schätzer von Null verschieden ist- Teststatistik:
mit:
- Die Kovarianz der Schätzer kann in der folgenden Weise angegeben werden, wenn einer der beiden Schätzer effizient ist:
- Bei Gültigkeit der Nullhpypothese folgt H asymptotisch einer χ2 –Verteilung.
)ˆˆ()'ˆˆ( 1REFEREFEH ββΣββ
)ˆˆ( REFECov ββΣ
)ˆ()ˆ()ˆˆ( REFEREFE CovCovCov ββββΣ
Institut für Arbeitsmarkt- und Berufsforschung
25
Hausman-Test Diskussion
- Unterschied FE- und RE-Schätzer kann durch Korrelation
zwischen Errorterm und erklärender Variable hervorgerufen sein.
- Unterschied kann auf Fehlspezifikation beider Modelle zurück-
zuführen sein.
- Bei Heteroskedastie oder serieller Korrelation ist die RE-Schätzung
nicht mehr effizient.
- Teststatistik gilt nur asymptotisch: Im praktischen Fall ständige
Probleme mit „negativen Varianzen“ und nicht positiv-def. Matrix
Institut für Arbeitsmarkt- und Berufsforschung
26
Lehrbücher zur Mehrebenenanalyse mit einer klaren Präferenz für Random Effects:
(Auszug)
De Leeuw, Meijer (2008), Gelman, Hill (2007), Schwetz, Subram-
anian (2005), Langer (2004), Snijders, Bosker (2004), Goldstein (2003),
Hox (2002), Little, Schnabel, Baumert (2000), Kreft, De Leeuw (1998),
Engel (1998), Ditton (1998), Hox (1994), Longford (1993), Searle,
Casella, McCulloch (1992), Bryk, Raudenbush (1992)
Der Hausman-Test wird jeweils nicht erwähnt
Institut für Arbeitsmarkt- und Berufsforschung
27
Lehrbücher zur Ökonometrie mit einer Darstel-lung von Random und Fixed-Effects Modellierung
(sehr kleiner Auszug)
Baltagi (2005), Greene (2003), Wooldridge (2002)
Der Hausman-Test wird jeweils behandelt
Institut für Arbeitsmarkt- und Berufsforschung
28
Die Bezeichnung Mehrebenenmodell in erster Linie in den Sozialwissenschaften üblich
In den Sozialwissenschaften sind Mehrebenenmodelle und Modellemit zufälligen Effekten (und Koeffizienten) nahezu synonym.
In der Ökonometrie wird bei der Anwendung eines Modells mit zufälligen Effekten ein Hausman-Test verlangt; dieser verwirft sehr häufig das Modell mit zufälligen Effekten.
Sofern er korrekt funktioniert!
Institut für Arbeitsmarkt- und Berufsforschung
29
4. Ein empirisches Beispiel
Institut für Arbeitsmarkt- und Berufsforschung
30
4. Kapitel: Ein empirisches Beispiel: Auswirkungen der regionalen Arbeitslosigkeit auf das Lohnniveau
Blanchflower/ Oswalds (1994, 2006) "empirisches Gesetz“:
Die Elastizität des Lohns im Hinblick auf die regionale Arbeitslosigkeit ist -0,1
ln Wr = -0,1 ln Ur + weitere Terme
(Lohnkurvenbeziehung)
Institut für Arbeitsmarkt- und Berufsforschung
31
Die Lohnkurve
U1 U2
W2
W1
regionale Arbeitslosenquote
Löhne
Lohnkurve
Arbeitsnachfrage Region 1
Arbeitsnachfrage Region 2
Institut für Arbeitsmarkt- und Berufsforschung
32
Bedeutung der Lohnkurvenbeziehung
In der Volkswirtschaftslehre:
Untersuchung einer Beziehung zwischen zwei fundamentalen ökonomischen Größen
Untersuchungen zur „Flexibilität“
In der Soziologie:
Verbindung zwischen zwei zentralen Dimensionen sozialer Ungleichheit
Institut für Arbeitsmarkt- und Berufsforschung
33
Theoretische Begründungen der Lohnkurve
Verhandlungsansätze:Arbeitslosigkeit schwächt die Position von Gewerkschaften und einzelnen Arbeitskräften in Lohnverhandlungen (Sanfey 1992)
Effizienzlohnansätze:Hohe Löhne und hohe Arbeitslosigkeit sind Substitute für die Firmen, um sich eine leistungsbereite und qualifizierte Belegschaft zu sichern (Shapiro/ Stiglitz 1984)
Institut für Arbeitsmarkt- und Berufsforschung
34
Hauptunterschied zwischen den wichtigsten Typen von Mehrebenenmodellen
Modelle mit zufälligen Effekten:Aufspaltung des Fehlerterms in zufällige Effekte, die verschiedenen Ebenen zugeordnet sind
Annahmen zur Unkorreliertheit von explanatorischen und Störvariablen
Modelle mit fixen Effekten:Schätzung der Effekte unbeobachteter Variabler höherer Ebenen als fixe Effekte von Dummyvariablen, Paneldaten vorausgesetzt
Institut für Arbeitsmarkt- und Berufsforschung
35
Modellspezifikationen: Mehrebenenmodelle mit fixen und zufälligen Effekten
Blanchflower/ Oswald: Individualdaten mit fixen Effekten:
Blanchflower/ Oswald: Aggregatdaten mit fixen Effekten:
Mehrebenenmodell (Individualdaten) mit zufälligen Effekten:
irttrrtu
irt UW ~lnln xirtβX
rttrrtu
rt UW ~lnln xrtβX
irtrtrtu
irt UW ~~lnln xirtβX
Institut für Arbeitsmarkt- und Berufsforschung
36
Daten der IAB-Beschäftigtenstichprobe (IABS)
1993-2004: 3 870 048 BeobachtungenRelevante Variablen:- Bruttolöhne- Geschlecht- Alter- Beruf- Qualifikation etc.
Zusammengefügt mit Arbeitslosenquoten und Gebietstypen für Kreise
Institut für Arbeitsmarkt- und Berufsforschung
37
Einige Untersuchungen zur deutschen Lohnkurve
Gerlach, Wagner (1994) Fixed Effects Blanchflower, Oswald (1994, 1996) Pooled/ Fixed EffectsBlien (1995) Random EffectsBellmann, Blien (1996/2001) Random EffectsBüttner (1996) Fixed EffectsBaltagi, Blien (1998) Fixed effectsBaltagi, Blien, Wolf (2000) Fixed Effects, OstdeutschlandPannenberg, Schwarze (2000) Fixed EffectsBaltagi, Blien, Wolf (2008) Fixed Effects
Institut für Arbeitsmarkt- und Berufsforschung
38
Ergebnisse (nur der Koeffizient für die Arbeitslosenquote)
Pooled RE FGLS RE ML FE
Individual o. R. -0,043 -0,027 -0,022 -0,020
Individual m. R. -0,079 -0,032 -0,025
Aggregat o. R. -0,050 -0,017 -0,011 -0,009
Aggregat m. R. -0,051 -0,018 -0,013
R: Regionstyp
Kürzere Zeitperioden:RE FGLS (2004): -0,067, RE FGLS (2001-04): -0,040, FE (2001-04): 0,028Alle Effekte sind hoch signifikant.
Institut für Arbeitsmarkt- und Berufsforschung
39
Hausman-Test
Prüfgröße: 1384,55Das Random Effects Modell wird abgelehnt
Aber: Aus der in der aktuellen Stata-Version ausgegebenen Information über die Konstruktion des Tests ist zu entnehmen, dassder Rang der Differenzen-Varianzmatrix nicht der Zahl der Variablen entspricht. Außerdem treten „negative Varianzen“ auf.
Verschiedene Optionen zur Variation der Berechnung des Testsverbessern das Ergebnis nur unwesentlich.
Institut für Arbeitsmarkt- und Berufsforschung
40
Ergebniszusammenfassung (1)
- Fixed Effects Modell nur möglich, weil durch den Einbezug der Zeit- dimension auch Aggregatvariablen aufgenommen werden können- Kombination von Aggregat- und Individualdaten im Mehrebenen- modell der Aggregatmodellierung überlegen- Fixed und Random Effects Modell der Pooled Regression überlegen- Kaum Unterschiede für Individualvariablen in den Varianten des Mehrebenenmodells- Beobachtung eines langen Zeitraums wichtig zur Identifikation der Lohnkurvenbeziehung
Institut für Arbeitsmarkt- und Berufsforschung
41
Ergebniszusammenfassung (2)
- Hausman-Test zur Prüfung des Random Effects Modells nicht in rationaler Weise realisierbar- Anwendung des Fixed Effects Modells erfordert weniger starke Annahmen
Institut für Arbeitsmarkt- und Berufsforschung
42
5. Fazit
Institut für Arbeitsmarkt- und Berufsforschung
43
5. Kapitel: Fazit
- Mehrebenenanalyse mächtiges Instrument zur Analyse
der sozialen und ökonomischen Eingebundenheit von Subjekten
- Unterschiede zwischen Fixed und Random Effects Modellen
sollten rational diskutiert werden, die Abgrenzung der Disziplinen
ist kein geeignetes Kriterium
- Die Diskussion über die Vorzüge der jeweiligen Ansätze sollte
fortgesetzt werden.