36
1 4. Einfache nichtlineare Panelmodelle 4.1 Binäre Probit- und Logitmodelle mit Querschnittsdaten Binäre abhängige Variablen in der Ökonometrie: Diese qualitativen Variablen haben genau zwei Ausprägungen und nehmen entweder den Wert eins oder den Wert null an. Beispiele für Modelle mit binären abhängigen Variablen in der (Mikro-) Ökono- metrie: Analyse der Determinanten für den Beschäftigungsstatus (d.h. beschäftigt oder nicht beschäftigt) einer Person Analyse der Determinanten für die Wahl einer Person für ein spezifisches Transportmittel (auf Basis einer multinomialen Variablen) Analyse der Determinanten für die starke Zustimmung einer Person zu ei- nem Programm (basierend auf einer Ordinalskalierung) Analyse der Determinanten für den Besitz einer spezifischen Versicherung bei Haushalten Analyse der Determinanten für das Überschreiten einer bestimmten Ge- winnschranke eines Unternehmens Analyse der Determinanten für die Innovationstätigkeit eines Unternehmens in den letzten drei Jahren

4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

1

4. Einfache nichtlineare Panelmodelle

4.1 Binäre Probit- und Logitmodelle mit Querschnittsdaten

Binäre abhängige Variablen in der Ökonometrie:

Diese qualitativen Variablen haben genau zwei Ausprägungen und nehmen

entweder den Wert eins oder den Wert null an.

Beispiele für Modelle mit binären abhängigen Variablen in der (Mikro-) Ökono-

metrie:

• Analyse der Determinanten für den Beschäftigungsstatus (d.h. beschäftigt

oder nicht beschäftigt) einer Person

• Analyse der Determinanten für die Wahl einer Person für ein spezifisches

Transportmittel (auf Basis einer multinomialen Variablen)

• Analyse der Determinanten für die starke Zustimmung einer Person zu ei-

nem Programm (basierend auf einer Ordinalskalierung)

• Analyse der Determinanten für den Besitz einer spezifischen Versicherung

bei Haushalten

• Analyse der Determinanten für das Überschreiten einer bestimmten Ge-

winnschranke eines Unternehmens

• Analyse der Determinanten für die Innovationstätigkeit eines Unternehmens

in den letzten drei Jahren

Page 2: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

2

Wahrscheinlichkeiten bei binären Probit- und Logitmodellen mit einer binären

abhängigen Variablen yi sowie einem Vektor von k erklärenden Variablen xi =

(xi1,…, xik)‘ und dem dazugehörigen Parametervektor β = (β1,…, βk)‘:

Marginale Wahrscheinlichkeitseffekte in binären Probit- und Logitmodellen:

• Marginaler Effekt einer erklärenden Variablen xih (h = 2,…, k) auf die Wahr-

scheinlichkeit pi(xi, β) = P(yi = 1|xi, β), ceteris paribus:

Es folgt für die Veränderung von pi(xi, β) bei einer Veränderung von xih um

den Betrag ∆xih:

Je kleiner ∆xih, desto besser ist diese lineare Approximation.

• Das Vorzeichen des Parameters βh gibt somit lediglich die Richtung des

marginalen Wahrscheinlichkeitseffektes von xih an

2iβ'x t

-2

i i i i i i i i

-

1F (β'x ) = Φ (β'x ) = p (x , β) = P(y = 1|x , β) = e dt

i

i

β'x

i i i i i i i i β'x

eF (β'x ) = Λ (β'x ) = p (x , β) = P(y = 1|x , β) =

1 + e

i i i i i i ii i h

ih ih i ih

p (x , β) F (β‘x ) dF (β‘x ) β‘x = = = f (β‘x )β

x x d(β‘x ) x

i i i h ihΔp (x , β) f(β‘x )β Δx

Page 3: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

3

Oft interessiert der marginale Effekt einer erklärenden Variablen xih für eine ty-

pische Beobachtung i = 1,…, n. Der durchschnittliche marginale Wahrschein-

lichkeitseffekt von xih kann mit fi(β‘xi)βh für jedes i berechnet werden:

Eine andere Möglichkeit besteht in der Berechnung des marginalen Wahr-

scheinlichkeitseffektes von xih an den arithmetischen Mitteln x = 1/n xni=1 i der

erklärenden Variablen über alle Beobachtungen i = 1,…, n:

Aufgrund der Nichtlinearitäten der Ansätze sind die beiden Effekte in der Regel

nicht identisch, können jedoch sehr ähnliche Werte annehmen.

Falls die erklärenden Variablen diskret sind, sollte eine diskrete Veränderung

von pi(xi, β) aufgrund einer diskreten Veränderung von ∆xih berechnet werden:

Auch hier ist es möglich, durchschnittliche (diskrete) Effekte und (diskrete) Ef-

fekte an den arithmetischen Mitteln x = 1/n xni=1 i zu bestimmen.

→ Die unbekannten Parameter in binären Probit- und Logitmodellen werden in

der Regel mit der Maximum Likelihood Methode (ML) geschätzt, obwohl die

Anwendung anderer Schätzmethoden wie GMM auch möglich ist. ML weist

jedoch im Vergleich wünschenswertere Eigenschaften auf (siehe später).

n

h i i h

i=1

1AMPE = f (β‘x )β

n

ih i hMPEM = f (β‘x)β

i i i i h ih i iΔp (x , β) = F (β‘x + β Δx ) - F (β‘x )

Page 4: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

4

Ansatz mit latenten Variablen:

Binäre Probit- und Logitmodelle mit Querschnittsdaten können auch durch eine

zugrunde liegende latente stetige Variable yi* (diese kann als Nutzen interpre-

tiert werden) motiviert werden, die durch β‘xi erklärt wird und einen Störterm εi

(für i = 1,…, n) gekennzeichnet ist:

Latente Variablen können nicht beobachtet werden, aber auf die beobachteten

Ausprägungen der binären abhängigen Variablen bezogen werden (i = 1,…, n):

Es folgt für die Wahrscheinlichkeit pi(xi, β), dass yi den Wert eins annimmt:

Falls εi standardnormalverteilt ist (mit Erwartungswert null und Varianz eins),

erhält man das binäre Probitmodell. Falls εi standardlogistischverteilt ist (mit Er-

wartungswert null und Varianz π2/3), erhält man das binäre Logitmodell. Die

Annahme einer (bekannten) Varianz von εi ist hier kein Problem, da sie in bei-

den Modellen nicht identifiziert ist. Die Annahme von null als Schrankenwert

dieses Ansatzes mit latenten Variablen ist auch unproblematisch, falls eine (ge-

nerell zu betrachtende) Konstante in β‘xi einbezogen wird.

*

i i iy = β'x + ε

*

i

i *

i

1 if y 0y =

0 if y < 0

*

i i i i i i i i i ip (x , β) = P(y = 1|x , β) = P(y 0|x , β) = P(β'x + ε 0) = P(ε -β'x )

Page 5: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

5

4.2 Maximum Likelihood Methode und statistische Testverfahren

Ausgangspunkt:

Mit einer Zufallsstichprobe y1,…, yn aus der Verteilung von yi sollen die unbe-

kannten Parameter im Vektor θ = (θ1, θ2,…, θm)‘ gesucht werden. Im Gegen-

satz zur GMM muss nun die gesamte Verteilung und damit die Dichte- oder

Wahrscheinlichkeitsfunktion von yi (z.B. Bernoulliverteilung, Poissonverteilung,

Normalverteilung) bekannt sein.

Aufgrund der Unabhängigkeit der yi ist die gemeinsame Wahrscheinlichkeits-

funktion (für diskrete Zufallsvariablen) oder die gemeinsame Dichtefunktion (für

stetige Zufallsvariablen) der y1,…, yn das Produkt der einzelnen Wahrschein-

lichkeits- bzw. Dichtefunktionen:

Falls diese Funktion nicht als Funktion der Zufallsstichprobe y1,…, yn (gegeben

die Parameter in θ) interpretiert wird, sondern als Funktion von θ für eine gege-

bene Zufallsstichprobe y1,…, yn, kann sie als eine Likelihood Funktion formu-

liert werden:

n

1 n 1 1 n n i i

i=1

f (y ,..., y ; θ) = f (y ; θ) f (y ; θ) = f (y ; θ)

n

i i

i=1

L(θ) = f (y ; θ)

Page 6: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

6

Die Idee der ML besteht darin, einen Wert θ für θ zu finden, der die Likelihood

Funktion auf der Grundlage der Zufallsstichprobe y1,…, yn maximiert. Die Maxi-

mierung erfolgt dabei in der Regel nicht auf der Basis der Likelihood Funktion

L(θ), sondern anhand der Loglikelihood Funktion (wobei sich log wieder auf

den natürlichen Logarithmus bezieht):

Die Maximierung von logL(θ) führt zum gleichen Schätzer θ wie die Maximie-

rung von L(θ). Vorteile der Verwendung der Loglikelihood Funktion:

• Die Nutzung von logL(θ) vermeidet extrem kleine Werte im Fall von diskre-

ten Zufallsvariablen (aufgrund der Multiplikation der Wahrscheinlichkeiten

und damit von Werten kleiner eins) und extrem hohen Werten im Fall von

stetigen Zufallsvariablen (falls Werte größer eins in den Dichtefunktionen

multipliziert werden)

• Im Allgemeinen ist auch der Maximierungsprozess mit der Loglikelihood

Funktion zur Ableitung von θ viel einfacher als mit der Likelihood Funktion

Maximierungsansatz:

n

1 1 n n i i

i=1

logL(θ) = logf (y ; θ) + + logf (y ; θ) = logf (y ; θ)

n'

1 2 m i iθ θ

i=1

ˆ ˆ ˆ ˆθ = θ , θ ,…, θ = arg max logL θ = arg max logf (y ; θ)

Page 7: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

7

Eine notwendige Bedingung für den ML-Schätzer θ ist, dass die erste Ableitung

der Loglikelihood Funktion (d.h. der Score) für diesen Wert von θ null ist:

Damit kann der Maximierungsprozess des ML-Schätzers folgendermaßen cha-

rakterisiert werden:

→ Alle zuvor betrachteten Konzepte für unbedingte Modelle mit einer Zufalls-

variablen yi können analog für ökonometrische Modelle mit der abhängigen

Variablen yi = (yi1,…, yiT)’ und den erklärenden Variablen in xi = (xi1‘,…, xiT

‘)‘

(bei Paneldaten) mit xit = (xit1,…, xitk)‘ (t = 1,…, T) übertragen werden

Mit der bedingten Wahrscheinlichkeits- oder Dichtefunktion fi(yi; xi, θ) von yi

und einer Zufallsstichprobe (yi, xi) (i = 1,…, n) ergeben sich für die Loglikeli-

hood Funktion und den Maximierungsansatz:

θ̂

logL(θ) = 0

θ

ni i

θi=1

logf (y ; θ)θ̂ = argsolves = 0

θ

n

i i i

i=1

logL(θ) = logf (y ; x , θ)n

i i iθ

i=1

θ̂ = arg max logf (y ; x , θ)

Page 8: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

8

Eigenschaften des ML-Schätzers θ von θ bei endlichen Stichprobenumfängen:

• θ ist meist ein verzerrter Schätzer für θ (z.B. ist der Erwartungswert von σ 2

im klassischen linearen Regressionsmodell nicht gleich σ2, wohingegen die

Erwartungstreue von β eine Ausnahme darstellt)

• θ ist typischerweise nicht normalverteilt (die Normalverteilung von β im klas-

sischen linearen Regressionsmodell ist wiederum eine Ausnahme)

• Die in der Regel unbekannten Eigenschaften von ML-Schätzern bei endli-

chen Stichprobenumfängen können mit Hilfe von Monte Carlo Experimenten

für spezifische ökonometrische Modelle und spezifische Parameterwerte un-

tersucht werden

Asymptotische Eigenschaften des ML-Schätzers θ von θ (unter verschiedenen

Regularitätsannahmen und unter der Annahme, dass das zugrundeliegende

Modell korrekt spezifiziert ist):

• Konsistenz: plim(θ ) = θ

• Asymptotische Normalverteilung für Funktionen von θ :

• Asymptotische Effizienz

a d

-1 -1ˆ ˆn(θ - θ) ~ N 0; I(θ) bzw. n (θ - θ) N 0; I(θ)

Page 9: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

9

Die Eigenschaft der asymptotischen Normalverteilung bedeutet, dass n(θ -θ) asymptotisch normalverteilt ist mit einem Erwartungswertvektor null und einer

Varianz-Kovarianzmatrix I(θ)-1. Die Matrix I(θ) wird als Informationsmatrix be-

zeichnet und weist die folgende Form auf:

Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert,

dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix für

einen beliebigen anderen konsistenten Schätzer für θ, bei dem n(θ -θ) eben-

falls asymptotisch normalverteilt ist, negativ definit ist. Da n(θ -θ) diese untere

Grenze erreicht, ist der ML-Schätzer asymptotisch effizient.

Es folgt, dass θ bei großen, aber endlichen Stichprobenumfängen mit n Beo-

bachtungen näherungsweise normalverteilt ist:

Jedoch ist die Informationsmatrix und damit Var(θ ) in der Praxis unbekannt, da

sie von θ abhängt. Daher muss sie z.B. für die Durchführung von statistischen

Tests und für die Konstruktion von Konfidenzintervallen (konsistent) geschätzt

werden. Var(θ ) kann geschätzt werden, indem man auf den ML-Schätzer θ an-

statt auf den wahren Parametervektor zurückgreift. In der Praxis werden ver-

schiedene Schätzer für die Varianz-Kovarianzmatrix genutzt.

2

i ilogf (y ;θ)I(θ) = -E

θ θ'

appr

-1θ̂ ~ N θ; nI(θ)

Page 10: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

10

Statistische (klassische) Testverfahren:

Die ML-Schätzung ökonometrischer Modelle führt zu einem entsprechenden

Punktschätzer, berücksichtigt aber nicht die Stichprobenvariation, die die Basis

für die Konstruktion von Konfidenzintervallen und für statistische Tests ist.

Mögliche Hypothesen beziehen sich auf Restriktionen im Parameterraum. Die

folgenden Null- und Alternativhypothesen beziehen sich auf q Restriktionen:

Im einfachsten Fall ist die Dimension der Funktion c(θ) q = 1 und c(θ) bezieht

sich auf spezifische Werte eines Parameters θl des Vektors θ, wodurch sich

folgende Nullhypothese ergibt (a ist hierbei eine beliebige Konstante):

Auf Basis der ML-Schätzung von ökonometrischen Modellen können diese

Nullhypothesen mit dem Wald, dem Score oder dem Likelihood-Quotienten

Test statistisch überprüft werden, die alle asymptotisch äquivalent sind.

1

0

q

1

c (θ) = 0

H : c(θ) = 0

c (θ) = 0

H : c(θ) 0

0 lH : θ = a

Page 11: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

11

Die Wald Teststatistik basiert auf dem unrestringierten ML-Schätzer θ :

I (θ ) ist eine konsistente Schätzung der Informationsmatrix und kann mit ver-

schiedenen Ansätzen zur Schätzung der Varianz-Kovarianzmatrix von θ be-

stimmt werden. Falls H0: c(θ) = 0, ist die Wald Teststatistik asymptotisch χ2-ver-

teilt mit q Freiheitsgraden, d.h.:

Somit wird die Nullhypothese (bei großen Stichprobenumfängen) zugunsten

der Alternativhypothese zum Signifikanzniveau α abgelehnt, falls:

Im Fall der spezifischen einfachen Nullhypothese H0: θl = a ist die entsprechen-

de Wald Teststatistik asymptotisch χ2-verteilt mit einem Freiheitsgrad. Daraus

ergibt sich die einfachste und wichtigste Version einer Wald Teststatistik, näm-

lich die z-Statistik (bzw. t-Statistik), die asymptotisch standardnormalverteilt ist:

-1ˆ ˆc(θ) c(θ)'ˆ ˆ ˆˆWT = nc(θ)' I(θ) c(θ)

θ' θ

d2

qWT χ

2

q;1-αWT > χ

dl

l

θ̂ -aWT = z = N(0; 1)

ˆˆVar(θ )

Page 12: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

12

Die geschätzte Varianz von θ l ist das entsprechende l-te Element auf der

Hauptdiagonalen der geschätzten Varianz-Kovarianzmatrix von θ . Die Nullhy-

pothese wird somit (bei großen Stichprobenumfängen) zum Signifikanzniveau

von α abgelehnt, falls:

Restringierte ML-Schätzung:

Ein ML-Schätzer θ r wird als restringierter ML-Schätzer bezeichnet, wenn die

zugrunde liegende ML-Schätzung auf spezifischen Restriktionen für die unbe-

kannten Parameter beruht. Im einfachsten Fall bezieht sich die Restriktion auf

spezifische Werte für unbekannte Parameter. Falls z.B. θ = (α, β)‘, kann α = 1

eine mögliche Restriktion sein, so dass für den restringierten ML-Schätzer θ r =

(1, β r)‘ gilt, wohingegen der unrestringierte Parameter θ u = (α u, β u)‘ ist.

Die Likelihood-Quotienten Teststatistik basiert auf dem Wert logL(θ r) der Log-

likelihood Funktion am (durch H0) restringierten ML-Schätzer und dem Wert

logL(θ u) am unrestringierten ML-Schätzer, wobei logL(θ r) ≤ logL(θ u):

Falls H0: c(θ) = 0, ist die Likelihood-Quotienten Teststatistik asymptotisch χ2-

verteilt mit q Freiheitsgraden, d.h.:

1-α/2z > z

u rˆ ˆLRT = 2 logL(θ ) - logL(θ )

d2

qLRT χ

Page 13: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

13

Somit wird die Nullhypothese (bei großen Stichprobenumfängen) zugunsten

der Alternativhypothese zum Signifikanzniveau α abgelehnt, falls:

Der wesentliche Vorteil dieses Tests ist dessen einfache Durchführung. Der

praktische Nachteil ist, dass zwei ökonometrische Modelle geschätzt werden

müssen.

Die Score Teststatistik basiert nur auf dem restringierten ML-Schätzer θ r:

Falls H0: c(θ) = 0, ist I (θ r) ein konsistenter Schätzer der Informationsmatrix und

kann mit verschiedenen Ansätzen geschätzt werden. Falls H0 korrekt ist, ist die

Score Teststatistik asymptotisch χ2-verteilt mit q Freiheitsgraden, d.h.:

Somit wird die Nullhypothese (bei großen Stichprobenumfängen) zugunsten

der Alternativhypothese zum Signifikanzniveau α abgelehnt, falls:

2

q;1-αLRT > χ

-1r rr

ˆ ˆlogL(θ ) logL(θ )1 ˆˆST = I(θ )n θ' θ

d2

qST χ

2

q;1-αST > χ

Page 14: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

14

4.3 ML-Schätzung in binären Probit- und Logitmodellen mit Quer-

schnittsdaten

Die binären abhängigen Variablen yi in entsprechenden ökonometrischen Mo-

dellen mit Querschnittsdaten sind Dummy-Variablen und damit generell Ber-

noulli verteilt mit der Wahrscheinlichkeit pi(xi, β). Basierend auf einer Zufalls-

stichprobe (xi, yi) mit i = 1,…, n Beobachtungen ergibt sich somit folgende spe-

zifische Loglikelihood Funktion:

In binären Probit- und Logitmodellen mit Querschnittsdaten folgt:

1 1 1 1 1 1

n n n n n n

n

i i i i i i

i=1

i i

logL(β) = y logp (x , β) + (1-y )log 1-p (x , β) + +

y logp (x , β) + (1-y )log 1-p (x , β)

= y logp (x , β) + (1-y )log 1-p (x , β)

= y logF (β‘x

n

i i i i

i=1

) + (1-y )log 1-F (β‘x )

n

i i i i i i

i=1

n

i i i i i i

i=1

logL(β) = y logΦ (β‘x ) + (1-y )log 1-Φ (β‘x )

logL(β) = y logΛ (β‘x ) + (1-y )log 1-Λ (β‘x )

Page 15: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

15

Die erste Ableitung der Loglikelihood Funktion hat folgendes Aussehen:

Der ML-Schätzer β löst die Bedingungen erster Ordnung bei der Maximierung

der Loglikelihood Funktion. Generell ist für β keine Lösung in geschlossener

Form verfügbar, so dass iterative numerische Optimierungsalgorithmen ange-

wendet werden müssen.

Der ML-Schätzer β ist in ökonometrischen Modellen mit binären abhängigen

Variablen bei großen, aber endlichen Stichprobenumfängen mit n Beobachtun-

gen näherungsweise normalverteilt mit folgender Varianz-Kovarianzmatrix:

Es folgt also:

Der Standardansatz für die Schätzung der Varianz-Kovarianzmatrix von β lau-

tet:

ni i i

i i i

i=1 i i i i

logL(β) y - F (β‘x ) = f (β‘x )x

β F (β‘x ) 1-F (β‘x )

-12n

-1i i i i

i=1 i i i i

f (β‘x ) x x 'ˆVar(β) = nI β = F (β‘x ) 1-F (β‘x )

-12nappr

i i i i

i=1 i i i i

f (β‘x ) x x 'β̂ ~ N β;

F (β‘x ) 1-F (β‘x )

Page 16: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

16

Für die Schätzung der Varianz-Kovarianzmatrix von β können aber auch alter-

native Ansätze betrachtet werden.

Auf Basis von β folgt für die Schätzer der marginalen Wahrscheinlichkeitseffek-

te einer erklärenden Variablen xih in binären Probit- und Logitmodellen:

Daraus ergeben sich über alle Beobachtungen i = 1,…, n die folgenden Schät-

zer des durchschnittlichen marginalen Wahrscheinlichkeitseffektes von xih so-

wie des marginalen Wahrscheinlichkeitseffektes an den arithmetischen Mitteln

x = 1/n xni=1 i der erklärenden Variablen:

Schließlich lassen sich Schätzer für die diskrete Veränderung von pi(xi, β) auf-

grund einer diskreten Veränderung ∆xih, für den durchschnittlichen diskreten

Wahrscheinlichkeitseffekt sowie für die diskrete Veränderung von pi(xi, β) an

den arithmetischen Mitteln der anderen erklärenden Variablen ableiten.

-1

2ni i i i

i=1 i i i i

ˆf (β‘x ) x x 'ˆˆVar(β) = ˆ ˆF (β‘x ) 1-F (β‘x )

i ii i h

ih

ˆp̂ (x , β) ˆ ˆ = f (β‘x )βx

n

h i i h

i=1

ih i h

1 ˆ ˆˆAMPE = f (β‘x )β n

ˆ ˆˆMPEM = f (β‘x)β

Page 17: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

17

4.4 Binäre Probit- und Logitmodelle mit Paneldaten

Für Panelmodelle mit binären abhängigen Variablen folgt aus dem Ansatz mit

latenten Variablen für eine Beobachtungseinheit i in Periode t:

Für die beobachteten binären abhängigen Variablen yit ergibt sich:

Erneut gelangt man bei entsprechenden Verteilungsannahmen für den Stör-

term εit (d.h. Standardnormal- bzw. standardlogistische Verteilung) zu binären

Probit- und Logitmodellen (hier mit Paneldaten) (siehe später).

Genauso wie bei linearen Panelmodellen liegt dabei häufig unbeobachtete He-

terogenität vor. Für die latenten Variablen ergibt sich:

Auch in diesem einfachen Fall nichtlinearer Panelmodelle kann zwischen ran-

dom und fixed effects Schätzungen unterschieden werden. Während binäre

fixed effects Schätzungen auf der Annahme basieren, dass die αi und xit korre-

liert sind, gehen binäre random effects Schätzungen davon aus, dass die αi

und xit unkorreliert sind, so dass die bedingte Verteilung fi(αi|xit) nicht von xit ab-

hängt.

*

it it ity = β'x + ε für i = 1,..., n; t = 1,..., T

*

it

it *

it

1 if y 0y =

0 if y < 0

*

it it i ity = β'x + α + v für i = 1,..., n ; t = 1,..., T

Page 18: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

18

Zudem ist es erneut möglich, die unbeobachtete Heterogenität zu ignorieren

und gepoolte binäre Probit- und Logitmodelle zu betrachten. Diese Ansätze un-

terstellen Unabhängigkeit über die Beobachtungseinheiten i = 1,…, n und die

Perioden t = 1,…, T und werden wie in Querschnittsanalysen behandelt. Je-

doch sind diese Schätzer bei unbeobachteter Heterogenität meist inkonsistent.

Für die Wahrscheinlichkeit, dass yit den Wert eins annimmt, ergibt sich bei ei-

ner spezifischen Verteilung des Störterms εit (der auch unbeobachtete Hetero-

genität mit εit = αi+vit aufweisen kann):

Über die Zeit hinweg folgt daraus für die spezifische Wahrscheinlichkeit, dass

die yi1,…, yiT jeweils den Wert eins annehmen:

Falls dagegen ein oder mehrere yi1,…, yiT über die Zeit den Wert null anneh-

men, ergeben sich bei der Berechnung der Wahrscheinlichkeiten entsprechend

abweichende Integrationsgrenzen.

it

*

it it it it it it it it

it it i it it

-β'x

p (x , β) = P(y = 1|x , β) = P(y 0|x , β) = P(β'x + ε 0)

= P(ε -β'x ) = f (ε )dε

i1 iT

i1 iT i i1 i1 iT iT

i1 i1 iT iT i i1 iT it iT

-β'x -β'x

P(y = 1;...; y = 1|x , β) = P(β'x + ε 0;...; β'x + ε 0) =

P(ε -β'x ;...; ε -β'x ) = f (ε ,..., ε )dε dε

Page 19: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

19

Diese Wahrscheinlichkeiten werden im Hinblick auf die ML-Schätzung für jede

Beobachtungseinheit i = 1,…, n in die Loglikelihood Funktion einbezogen. Im

flexibelsten Fall, dass die εit beliebig über die Zeit korreliert sind, ergibt sich für

diese gemeinsamen Wahrscheinlichkeiten ein T-dimensionales Integral. Bei

großen T ist die Berechnung dieses Mehrfachintegrals im iterativen Maximie-

rungsprozess der ML-Schätzung nicht einfach durchführbar. Eine Möglichkeit

dieser Berechnung besteht in der Approximation der Wahrscheinlichkeiten

durch Simulatoren (siehe Artikel in Ecological Economics).

Eine alternative Möglichkeit der Vereinfachung bietet die binäre random effects

Schätzung. Dabei kann die gemeinsame Dichtefunktion fi(εi1,…, εiT, αi) folgen-

dermaßen formuliert werden:

Daraus folgt:

Die untere Gleichung kann abgeleitet werden, da die εit unter der Bedingung

von αi unabhängig sind. Bei der Einbeziehung dieser Gleichung in die spezifi-

sche Wahrscheinlichkeit, dass die yi1,…, yiT jeweils den Wert eins annehmen,

ergibt sich nach einigen Umformungen:

i i1 iT i i i1 iT i i if (ε ,..., ε , α ) = f (ε ,..., ε |α )f (α )

i i1 iT i i1 iT i i i i

-

T

i it i i i i

t=1-

f (ε ,..., ε ) = f (ε ,..., ε |α )f (α )dα

= f (ε |α )f (α )dα

Page 20: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

20

Durch das Herausintegrieren von αi sind die Wahrscheinlichkeiten jetzt nur

noch durch ein eindimensionales und nicht mehr durch ein T-dimensionales In-

tegral gekennzeichnet. In der Regel wird dabei angenommen, dass die αi nor-

malverteilt sind (andere Verteilungsannahmen sind möglich, aber meist proble-

matisch, da dann keine geschlossene Form des Integrals oder einfache Metho-

de zur Approximation des Integrals vorliegen). Die auf der Normalverteilungs-

annahme basierende Approximation des äußeren Einfachintegrals erfolgt übli-

cherweise (z.B. in STATA) mit der Gauss-Hermite Quadraturmethode.

Bei den random effects Schätzungen im binären Probitmodell und im binären

Logitmodell (mit unbeobachteter Heterogenität) folgt:

Die Wahrscheinlichkeiten P(yit = 1|xit, β, αi), dass yit den Wert eins annimmt,

sind also nicht mehr identisch mit den entsprechenden Wahrscheinlichkeiten

Φi(β‘xit) und Λi(β‘xit) in gepoolten binären Probit- und Logitmodellen.

T

i1 iT i it it i i i i

t=1

P(y = 1;...; y = 1|x , β) = P(y = 1|x , β, α ) f (α )dα

T

i1 iT i i it i i i i

t=1

T

i1 iT i i it i i i i

t=1

P(y = 1;...; y = 1|x , β) = Φ (β'x +α ) f (α )dα

P(y = 1;...; y = 1|x , β) = (β'x +α ) f (α )dα

Page 21: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

21

Damit sind die entsprechenden Parameter nicht mehr mit den Parametern in

gepoolten Probit- und Logitmodellen zu vergleichen. Im allgemeinen Fall ergibt

sich bei den random effects Schätzungen im binären Probitmodell und im binä-

ren Logitmodell unter Einbeziehung der Wahrscheinlichkeitsfunktion der Ber-

noulli verteilten yit für die Wahrscheinlichkeit, dass die yi1,…, yiT über die Zeit

variierend die Werte null oder eins annehmen:

Anmerkungen:

• Bei diesen Ansätzen wird in STATA die geschätzte Standardabweichung σ α

der αi sowie der Schätzwert co rr(εit, εis) = ρ = σ α2/(1+ σ α

2) der Korrelation der

Störterme für zwei beliebige Perioden t und s ausgewiesen

• Marginale Wahrscheinlichkeitseffekte hängen von den unbekannten αi ab,

die bei den random effects Schätzungen herausintegriert werden. Deshalb

können diese (ebenso wie bei fixed effects Schätzungen in binären Logitmo-

dellen, siehe später) nicht zuverlässig geschätzt werden (eine entsprechen-

de Anweisung in STATA schätzt diese Effekte für αi = 0). Allerdings ergibt

sich aus dem Vorzeichen der geschätzten Parameter weiterhin das Vorzei-

chen des geschätzten marginalen Wahrscheinlichkeitseffektes.

itit

itit

T1-yy

i it i i it i i i i

t=1

T1-yy

i it i i it i i i i

t=1

Φ (β'x +α ) 1-Φ (β'x +α ) f (α )dα

(β'x +α ) 1- (β'x +α ) f (α )dα

Page 22: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

22

Fixed effects Schätzung im binären Logitmodell:

• Im Gegensatz zur Dummy-Variablen Schätzung in linearen Panelmodellen

mit unbeobachteter Heterogtenität, die bei kleinen T konsistent ist, ist die ge-

meinsame fixed effects Schätzung der einzelnen αi und der anderen Para-

meter in β in binären Panelmodellen generell inkonsistent, falls nicht T → ∞

• Der Grund hierfür ist das incidental Parameterproblem, wonach die n inci-

dental (beiläufigen) Parameter αi bei kleinen T nicht konsistent geschätzt

werden können, da nur T Beobachtungen für die Schätzung jedes αi vorlie-

gen. Da aber die Schätzung von β eine Funktion der Schätzung der αi ist,

wird auch β bei kleinen T inkonsistent geschätzt.

• Um dennoch konsistente Schätzer in binären Panelmodellen zu erhalten,

müssen die αi eliminiert werden. Jedoch ist es für viele nichtlineare Panel-

modelle mit unbeobachteter Heterogenität und insbesondere für binäre Pro-

bitmodelle nicht möglich, diese Eliminierung durchzuführen.

• Dagegen ist eine fixed effects Schätzung in binären Logitmodellen möglich,

indem ein konditionaler ML-Schätzer genutzt wird. Dabei bleiben (ohne Ef-

fekt auf die Konsistenz des Schätzers) jene Beobachtungseinheiten unbe-

rücksichtigt, bei denen die yi1,…, yiT über die Zeit entweder durchweg null

oder durchweg eins sind, da sie nicht zur bedingten Likelihood Funktion bei-

tragen.

• Auch bei fixed effects Schätzungen in binären Panelmodellen sind die Para-

meter zeitinvarianter erklärender Variablen nicht identifiziert

Page 23: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

23

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Gewerkschaftszugehörigkeit (I)

Für die Analyse der Determinanten der Gewerkschaftszugehörigkeit (union)

werden die bereits mehrfach untersuchten Paneldaten für 545 dauerhaft be-

rufstätige Männer für die Jahre von 1980 bis 1987 betrachtet. Dabei werden

neben den Dummy-Variablen für die Jahre 1981 bis 1987 die Anzahl der Ar-

beitsstunden (hours), Bildungsstand (educ), Erfahrung (exper) sowie Dummy-

Variablen für Hautfarbe (black) und Familienstand (married) als erklärende Va-

riablen einbezogen. Es werden folgende Schätzungen betrachtet:

• ML-Schätzung im gepoolten binären Probitmodell

• Random effects Schätzung im binären Probitmodell

• Random effects Schätzung im binären Logitmodell

• Fixed effects Schätzung im binären Logitmodell

Zudem wird mit Wald Tests die Nullhypothese überprüft, dass black und

married gemeinsam keinen Effekt auf union haben. Darüber hinaus werden

Schätzungen der durchschnittlichen Wahrscheinlichkeit für verheiratete Perso-

nen, der durchschnittlichen marginalen Wahrscheinlichkeitseffekte sowie der

marginalen Wahrscheinlichkeitseffekte an den arithmetischen Mitteln aller er-

klärenden Variablen betrachtet.

Bei den Schätzungen mit STATA haben sich folgende Ergebnisse gezeigt:

---------------------------------------------------------------------------------------------------------

Page 24: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

24

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Gewerkschaftszugehörigkeit (II)

probit union hours educ exper black married d81 d82 d83 d84 d85 d86 d87

Probit regression Number of obs = 4360

LR chi2(12) = 88.58

Prob > chi2 = 0.0000

Log likelihood = -2378.5103 Pseudo R2 = 0.0183

------------------------------------------------------------------------------

union | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

hours | -.0001562 .0000396 -3.95 0.000 -.0002339 -.0000786

educ | .0136287 .0150325 0.91 0.365 -.0158345 .0430919

exper | .0290401 .0157643 1.84 0.065 -.0018572 .0599375

black | .4504348 .0624693 7.21 0.000 .3279972 .5728724

married | .2002097 .0455021 4.40 0.000 .1110271 .2893922

d81 | -.0379511 .0845171 -0.45 0.653 -.2036016 .1276995

d82 | -.0527078 .088485 -0.60 0.551 -.2261352 .1207197

d83 | -.1184943 .0955448 -1.24 0.215 -.3057587 .0687701

d84 | -.1338274 .1040118 -1.29 0.198 -.3376868 .070032

d85 | -.2582136 .1147486 -2.25 0.024 -.4831167 -.0333106

d86 | -.3337077 .1262056 -2.64 0.008 -.581066 -.0863493

d87 | -.193904 .1366117 -1.42 0.156 -.4616579 .07385

_cons | -.7119195 .2253402 -3.16 0.002 -1.153578 -.2702607

------------------------------------------------------------------------------

test black married

( 1) [union]black = 0

( 2) [union]married = 0

chi2( 2) = 62.41

Prob > chi2 = 0.0000

---------------------------------------------------------------------------------------------------------

Page 25: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

25

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Gewerkschaftszugehörigkeit (III)

margins, at (married=1)

Predictive margins Number of obs = 4360

Model VCE : OIM

Expression : Pr(union), predict()

at : married = 1

------------------------------------------------------------------------------

| Delta-method

| Margin Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

_cons | .2795636 .0107562 25.99 0.000 .2584818 .3006455

------------------------------------------------------------------------------

margins, dydx(hours educ exper black married)

Average marginal effects Number of obs = 4360

Model VCE : OIM

Expression : Pr(union), predict()

dy/dx w.r.t. : hours educ exper black married

------------------------------------------------------------------------------

| Delta-method

| dy/dx Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

hours | -.0000481 .0000121 -3.96 0.000 -.0000718 -.0000243

educ | .0041928 .0046238 0.91 0.365 -.0048697 .0132553

exper | .008934 .0048453 1.84 0.065 -.0005626 .0184305

black | .1385727 .0189159 7.33 0.000 .1014984 .1756471

married | .0615929 .0139243 4.42 0.000 .0343018 .088884

------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

Page 26: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

26

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Gewerkschaftszugehörigkeit (IV)

margins, dydx(*) atmeans

Conditional marginal effects Number of obs = 4360

Model VCE : OIM

Expression : Pr(union), predict()

dy/dx w.r.t. : hours educ exper black married d81 d82 d83 d84 d85 d86 d87

at : hours = 2191.257 (mean)

educ = 11.76697 (mean)

exper = 6.514679 (mean)

black = .1155963 (mean)

married = .4389908 (mean)

d81 = .125 (mean)

⋮ ⋮ ⋮ d87 = .125 (mean)

------------------------------------------------------------------------------

| Delta-method

| dy/dx Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

hours | -.0000486 .0000123 -3.95 0.000 -.0000727 -.0000245

educ | .004238 .0046745 0.91 0.365 -.0049237 .0133998

exper | .0090305 .0049012 1.84 0.065 -.0005758 .0186367

black | .1400693 .0194139 7.21 0.000 .1020187 .1781199

married | .0622581 .0141336 4.40 0.000 .0345568 .0899594

d81 | -.0118014 .0262817 -0.45 0.653 -.0633126 .0397097

⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | -.0602973 .0424765 -1.42 0.156 -.1435497 .0229551

------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

Page 27: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

27

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Gewerkschaftszugehörigkeit (V)

Interpretation:

• Der ausgewiesene Wert von 88,58 der Likelihood-Quotienten Teststatistik

impliziert, dass die 12 erklärenden Variablen gemeinsam einen hochsignifi-

kanten Effekt auf die (Wahrscheinlichkeit der) Gewerkschaftszugehörigkeit

haben

• Die Anzahl der Arbeitsstunden hat einen signifikant negativen Effekt und

Erfahrung, Hautfarbe und Familienstand haben einen signifikant positiven

Effekt auf die Gewerkschaftszugehörigkeit, wohingegen Bildungsstand kei-

nen signifikanten Effekt hat

• Die Stärke der Effekte ist allerdings nicht anhand der geschätzten Parame-

ter zu erkennen

• Die Wald Teststatistik von 62,41 in Bezug auf black und married impliziert,

dass diese beiden Variablen gemeinsam einen hochsignifikanten Effekt auf

union haben

• Die geschätzte durchschnittliche Wahrscheinlichkeit der Gewerkschaftszu-

gehörigkeit bei verheirateten Personen (also bei married=1) beträgt 0,2796

oder 27,96%

---------------------------------------------------------------------------------------------------------

Page 28: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

28

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Gewerkschaftszugehörigkeit (VI)

Weitere Anmerkungen:

• Es zeigen sich sehr ähnliche Schätzwerte bei den durchschnittlichen margi-

nalen Wahrscheinlichkeitseffekten im Vergleich zu den marginalen Wahr-

scheinlichkeitseffekten an den arithmetischen Mitteln aller erklärenden Vari-

ablen

• Der Schätzwert des durchschnittlichen marginalen Wahrscheinlichkeitseffek-

tes von hours impliziert, dass eine zusätzliche Arbeitsstunde zu einer ge-

schätzten Verminderung der Wahrscheinlichkeit der Gewerkschaftszugehö-

rigkeit um 0,0000481 bzw. 0,005 Prozentpunkte führt (die Interpretation ei-

ner geschätzten Verminderung um 5 Prozentpunkte bei einer Erhöhung um

1000 Arbeitsstunden kann aufgrund der marginalen Betrachtung der Wahr-

scheinlichkeitseffekte starke Ungenauigkeiten aufweisen)

• Die Betrachtung von marginalen Wahrscheinlichkeitseffekten für black und

married machen aufgrund des diskreten Charakters dieser erklärenden Va-

riablen keinen großen Sinn: Der diskrete Wahrscheinlichkeitseffekt von

married kann mit der zusätzlichen Betrachtung der durchschnittlichen Wahr-

scheinlichkeit der Gewerkschaftszugehörigkeit bei married=0 geschätzt wer-

den.

---------------------------------------------------------------------------------------------------------

Page 29: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

29

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Gewerkschaftszugehörigkeit (VII)

xtprobit union hours educ exper black married d81 d82 d83 d84 d85 d86 d87, re

Random-effects probit regression Number of obs = 4360

Group variable: nr Number of groups = 545

Random effects u_i ~ Gaussian Obs per group: min = 8

avg = 8.0

max = 8

Wald chi2(12) = 36.44

Log likelihood = -1654.7858 Prob > chi2 = 0.0003

------------------------------------------------------------------------------

union | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

hours | -.0001465 .000068 -2.16 0.031 -.0002797 -.0000133

educ | -.0218644 .0594262 -0.37 0.713 -.1383377 .0946089

exper | .0390217 .0620561 0.63 0.529 -.082606 .1606494

black | .8830474 .2561121 3.45 0.001 .3810769 1.385018

married | .2079123 .0900752 2.31 0.021 .0313682 .3844563

d81 | -.0632666 .1288576 -0.49 0.623 -.3158229 .1892897

⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | -.244501 .4474486 -0.55 0.585 -1.121484 .6324821

_cons | -1.049039 .8320243 -1.26 0.207 -2.679777 .5816985

-------------+----------------------------------------------------------------

/lnsig2u | 1.072764 .1140511 .8492275 1.2963

-------------+----------------------------------------------------------------

sigma_u | 1.709809 .0975029 1.529 1.912

rho | .7451221 .02166 .7004051 .7852116

------------------------------------------------------------------------------

Likelihood-ratio test of rho=0: chibar2(01) = 1447.45 Prob >= chibar2 = 0.000

---------------------------------------------------------------------------------------------------------

Page 30: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

30

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Gewerkschaftszugehörigkeit (VIII)

test black married

( 1) [union]black = 0

( 2) [union]married = 0

chi2( 2) = 16.07

Prob > chi2 = 0.0003

margins, predict(pu0) dydx(hours educ exper black married) atmeans

Conditional marginal effects Number of obs = 4360

Model VCE : OIM

Expression : Pr(union=1 assuming u_i=0), predict(pu0)

dy/dx w.r.t. : hours educ exper black married

at : hours = 2191.257 (mean)

educ = 11.76697 (mean)

exper = 6.514679 (mean)

black = .1155963 (mean)

married = .4389908 (mean)

d81 = .125 (mean)

⋮ ⋮ ⋮ ------------------------------------------------------------------------------

| Delta-method

| dy/dx Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

hours | -.0000219 .0000105 -2.08 0.037 -.0000426 -1.29e-06

educ | -.0032754 .008897 -0.37 0.713 -.0207133 .0141625

exper | .0058457 .009328 0.63 0.531 -.0124368 .0241282

black | .1322865 .0409942 3.23 0.001 .0519393 .2126338

married | .0311467 .014028 2.22 0.026 .0036523 .0586411

------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

Page 31: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

31

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Gewerkschaftszugehörigkeit (IX)

margins, predict(pu0) dydx(hours educ exper black married)

Average marginal effects Number of obs = 4360

Model VCE : OIM

Expression : Pr(union=1 assuming u_i=0), predict(pu0)

dy/dx w.r.t. : hours educ exper black married

------------------------------------------------------------------------------

| Delta-method

| dy/dx Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

hours | -.0000226 .0000108 -2.09 0.037 -.0000439 -1.39e-06

educ | -.0033776 .0091799 -0.37 0.713 -.0213698 .0146146

exper | .006028 .0096293 0.63 0.531 -.012845 .0249011

black | .1364127 .041729 3.27 0.001 .0546254 .2182

married | .0321182 .0144282 2.23 0.026 .0038394 .060397

------------------------------------------------------------------------------

margins, predict(pu0) at (married=1)

Predictive margins Number of obs = 4360

Model VCE : OIM

Expression : Pr(union=1 assuming u_i=0), predict(pu0)

at : married = 1

------------------------------------------------------------------------------

| Delta-method

| Margin Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

_cons | .1127145 .0193129 5.84 0.000 .074862 .1505671

------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

Page 32: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

32

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Gewerkschaftszugehörigkeit (X)

xtlogit union hours educ exper black married d81 d82 d83 d84 d85 d86 d87, re

Random-effects logistic regression Number of obs = 4360

Group variable: nr Number of groups = 545

Random effects u_i ~ Gaussian Obs per group: min = 8

avg = 8.0

max = 8

Wald chi2(12) = 36.72

Log likelihood = -1652.7964 Prob > chi2 = 0.0002

------------------------------------------------------------------------------

union | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

hours | -.0002876 .0001217 -2.36 0.018 -.0005262 -.000049

educ | -.0322533 .1023927 -0.31 0.753 -.2329394 .1684327

exper | .0717738 .1075846 0.67 0.505 -.1390882 .2826358

black | 1.584896 .4453701 3.56 0.000 .7119866 2.457805

married | .3784846 .1590169 2.38 0.017 .0668172 .6901519

d81 | -.1066676 .2308675 -0.46 0.644 -.5591597 .3458244

⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | -.4290466 .7775902 -0.55 0.581 -1.953095 1.095002

_cons | -1.920652 1.439615 -1.33 0.182 -4.742245 .9009418

-------------+----------------------------------------------------------------

/lnsig2u | 2.221506 .1159724 1.994204 2.448808

-------------+----------------------------------------------------------------

sigma_u | 3.036644 .1760834 2.710416 3.402137

rho | .7370435 .0224767 .690692 .7786747

------------------------------------------------------------------------------

Likelihood-ratio test of rho=0: chibar2(01) = 1451.84 Prob >= chibar2 = 0.000

---------------------------------------------------------------------------------------------------------

Page 33: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

33

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Gewerkschaftszugehörigkeit (XI)

Interpretation:

• Die random effects Schätzungen im binären Logitmodell sind erwartungsge-

mäß qualitativ sehr ähnlich zu den random effects Schätzungen im binären

Probitmodell. Die unterschiedlichen Schätzwerte ergeben sich durch die un-

terschiedlichen implizit einbezogenen Varianzen bei standardnormalverteil-

ten und standardlogistischverteilten Zufallsvariablen.

• Die ML-Schätzwerte implizieren, dass die Anzahl der Arbeitsstunden einen

signifikant negativen Effekt und Hautfarbe und Familienstand einen signifi-

kant positiven Effekt auf die Gewerkschaftszugehörigkeit haben, wohinge-

gen der Effekt der Erfahrung insignifikant wird

• Die ausgewiesenen Werte von 36,44 und 36,72 der Wald Teststatistiken im-

plizieren, dass die 12 erklärenden Variablen gemeinsam weiterhin einen

hochsignifikanten Effekt auf die Gewerkschaftszugehörigkeit haben (wenn

auch mit einer etwas geringeren Signifikanz)

• Die Werte von 1,709809 und 1,072764 [= log(1,7098092)] bei der random

effects Schätzung im binären Probitmodell stellen die geschätzte Standard-

abweichung der αi sowie den (natürlichen) Logarithmus der geschätzten Va-

rianz der αi dar. Der Wert von 0,7451221 [= 1,7098092/(1+1,7098092)] ist die

geschätzte Korrelation der Störterme für zwei beliebige Perioden.

---------------------------------------------------------------------------------------------------------

Page 34: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

34

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Gewerkschaftszugehörigkeit (XII)

Weitere Anmerkungen:

• Der ausgewiesene Wert von 1447,45 der Likelihood-Quotienten Teststatistik

bei der random effects Schätzung im binären Probitmodell impliziert, dass

die Hypothese, dass keine unbeobachtete Heterogenität vorliegt (d.h. dass

die Korrelation der Störterme für zwei beliebige Perioden null ist), bei einem

sehr geringen Signifikanzniveau verworfen werden kann

• Die Wald Teststatistik von 16,07 in Bezug auf black und married auf Basis

der random effects Schätzung im binären Probitmodell impliziert, dass diese

beiden Variablen gemeinsam einen etwas weniger signifikanten, aber noch

immer hochsignifikanten Effekt auf union haben

• Bei den Schätzwerten der durchschnittlichen marginalen Wahrscheinlich-

keitseffekte, der marginalen Wahrscheinlichkeitseffekte an den arithmeti-

schen Mitteln aller erklärenden Variablen sowie der durchschnittlichen Wahr-

scheinlichkeit der Gewerkschaftszugehörigkeit bei verheirateten Personen

ist zu beachten, dass sie auf der Annahme αi = 0 beruhen. Aus diesem

Grund sind diese Schätzungen nicht sehr aussagekräftig.

---------------------------------------------------------------------------------------------------------

Page 35: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

35

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Gewerkschaftszugehörigkeit (XIII)

xtlogit union hours educ exper black married d82 d83 d84 d85 d86 d87, fe

note: multiple positive outcomes within groups encountered.

note: 299 groups (2392 obs) dropped because of all positive or

all negative outcomes.

note: educ omitted because of no within-group variance.

note: black omitted because of no within-group variance.

Iteration 0: log likelihood = -730.74184

Iteration 1: log likelihood = -730.38833

Iteration 2: log likelihood = -730.38832

Conditional fixed-effects logistic regression Number of obs = 1968

Group variable: nr Number of groups = 246

Obs per group: min = 8

avg = 8.0

max = 8

LR chi2(9) = 20.79

Log likelihood = -730.38832 Prob > chi2 = 0.0136

------------------------------------------------------------------------------

union | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

hours | -.0002521 .0001245 -2.03 0.043 -.000496 -8.13e-06

educ | 0 (omitted)

exper | -.0307687 .2066957 -0.15 0.882 -.4358848 .3743474

black | 0 (omitted)

married | .3024055 .1705954 1.77 0.076 -.0319554 .6367664

d82 | .1048254 .3552208 0.30 0.768 -.5913945 .8010453

⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .3072396 1.346993 0.23 0.820 -2.332818 2.947297

------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

Page 36: 4. Einfache nichtlineare Panelmodelle · Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert, dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix

36

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Gewerkschaftszugehörigkeit (XIV)

Anmerkungen:

• Bei der fixed effects Schätzung im binären Logitmodell werden 299 Beob-

achtungseinheiten eliminiert, bei denen die yi1,…, yiT über die Zeit entweder

durchweg null oder durchweg eins sind. Zudem können die zeitinvarianten

erklärenden Variablen educ und black nicht in die Schätzung einbezogen

werden.

• Die fixed effects Schätzungen im binären Logitmodell implizieren, dass die

Anzahl der Arbeitsstunden weiterhin einen signifikant negativen Effekt hat,

wohingegen married nur noch auf einem Signifikanzniveau von 10% einen

Effekt hat

• Generell hat die fixed effects Schätzung von binären Logitmodellen gegen-

über der random effects Schätzung von binären Probit- und Logitmodellen

den Vorteil, dass sie auch bei einer Korrelation von αi und xit konsistent ist.

Diesem Vorteil stehen aber einige praktische Nachteile (z.B. keine Einbe-

ziehung von zeitinvarianten erklärenden Variablen, noch größere Probleme

bei der Schätzung von marginalen Wahrscheinlichkeitseffekten) gegenüber.

---------------------------------------------------------------------------------------------------------