25
EViews 7 2 2008 7 10 目次 1 2 項選択問題 2 1.1 2 ............................................. 2 1.2 2 ロジットモデル .......................................... 2 1.3 2 プロ ットモデル ........................................ 3 1.4 ................................................ 3 1.5 データ ......................................... 6 1.6 データ ............................................. 9 1.7 2 ロジット ........................................... 11 1.8 2 プロ ット .......................................... 14 2 順序選択問題 17 2.1 ............................................. 17 2.2 ロジットモデル ......................................... 18 2.3 プロ ットモデル ........................................ 18 2.4 ................................................ 18 2.5 データ ....................................... 19 2.6 ロジットモデル ......................................... 19 2.7 プロ ットモデル ........................................ 22 * – 1/25 EViews マニュアル Copyright © 2008 Konishi and Itoh. All rights reserved.

EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

EViewsの使い方 第 7章 離散選択問題

小西葉子 ∗ 伊藤有希†

第 2版 2008年 7月 10日

目次

1 2項選択問題 2

1.1 2項選択問題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 2項ロジットモデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.3 2項プロビットモデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.4 実証分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.5 データの読み込み方 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.6 データの加工 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.7 2項ロジット分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .11

1.8 2項プロビット分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14

2 順序選択問題 17

2.1 順序選択問題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17

2.2 順序ロジットモデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18

2.3 順序プロビットモデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18

2.4 実証分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18

2.5 データの読み込みと加工 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .19

2.6 順序ロジットモデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .19

2.7 順序プロビットモデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .22

– 1/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 2: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

1 2項選択問題

1 2項選択問題

1.1 2項選択問題

被説明変数 yi が 0と 1の 2値(バイナリー)しかとらない場合、通常の OLS推定を行うと問題が生じる。

代表的な問題としては、推定値が区間 [0, 1]の外の値をとる可能性がある問題や、被説明変数が 0と 1の 2値

しかないため残差も 2値となり、残差が正規分布に従うという通常の OLSの仮定に反する問題などが挙げら

れる。

そのため、説明変数 xi = (1, x1,i, · · · , xk,i)⊤ とその係数 β = (β0, β1, · · · , βk)⊤ の内積を何らかの関数を

用いて変形し 0と 1の間の値をとるようにする。つまり、以下の式で 0 ≤ G(x⊤

i β)≤ 1となるような関数 G

を用いる。標本 iが 1の値をとる確率を πi とすると

πi , P {yi = 1|xi}

= G(x⊤β

)(1)

となる。Gにロジスティック分布の分布関数を用いたモデルを 2項ロジットモデルと呼び、標準正規分布関

数を用いたモデルを 2項プロビットモデルと呼ぶ。

1.2 2項ロジットモデル

2項ロジットモデルについて説明を行う。(1)の Gに、ロジスティック分布の分布関数を用いるのが 2項ロ

ジットモデルである。

πi = P {yi = 1|xi}

= G(x⊤β

)= Λ

(x⊤

i β)

=exp

{x⊤

i β}

1 + exp{x⊤

i β} (2)

=exp {β0 + β1x1,i + · · · + βkxk,i}

1 + exp {β0 + β1x1,i + · · · + βkxk,i}

1 − πi = P {yi = 0|xi}

= 1 − P {yi = 1|xi} = 1 − Λ(x⊤

i β)

ただし、Λ(z) = exp{z}1+exp{z} はロジスティック分布の分布関数とする。このとき、対数尤度関数は以下のように

なる。

lnL (β;y, x) =n∑

i=1

{yi lnΛ

(x⊤

i β)

+ (1 − yi) ln(1 − Λ

(x⊤

i β))}

尤度関数(あるいは対数尤度関数)を最大化するようにパラメーターを β̂ を推定(最尤法)する。

– 2/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 3: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

1 2項選択問題 1.3 2項プロビットモデル

1.3 2項プロビットモデル

(1)の Gに、標準正規分布関数を用いるのが 2項プロビットモデルである。

πi = P {yi = 1|xi}

= G(x⊤β

)= Φ

(x⊤

i β)

=∫ x⊤β

−∞

1√2π

e−t22 dt (3)

ただし、Φ =∫ z

−∞1√2π

e12 t2dt は標準正規分布の分布関数とする。このとき、対数尤度関数は以下のように

なる。

lnL (β; y, x) =n∑

i=1

{yi − Φ

(x⊤

i β)

Φ(x⊤

i β) [

1 − Φ(x⊤

i β)]}

ϕ(x⊤

i β)xi

ただし、ϕ(z)は標準正規分布の確率密度関数とする。尤度関数(あるいは対数尤度関数)を最大化するように

パラメーターを β̂ を推定(最尤法)する。

1.4 実証分析

1.4.1 データ

アメリカの国勢調査の 1%サンプリングデータを用いて、ニューヨーク州の女性の就業状態に関する分析

を行った。データはマイクロデータ(micro data:個票データ、非集計データとも呼ばれる)である。データ

の出所は U.S. Census Bureau(国勢調査局)の Census 2000 data(2000年国勢調査)の 1-Percent Public Use

Microdataである*1。分析に用いた変数の意味などは表 1を参照。

今回は、25歳から 34歳以下の女性の就業状態に関して分析を行った。標本数は 13113である。分析結果は

表 2、表 3、表 4にまとめた。

1.4.2 モデルと結果

被説明変数を、esrxとして 2項ロジットモデルを用いて分析を行った。

*1 今回、分析で用いたデータは http://www.census.gov/Press-Release/www/2003/PUMS.html から入手可能である。*3 変数名の後ろに数字がついているものは、元々のデータにはなく、新たに EViewsで作成した変数である。

– 3/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 4: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

1 2項選択問題 1.4 実証分析

変数名 意味

age 年齢

paocf 対象外(男性、16歳未満の女性)=0、6歳未満の子供のみがいる=1、

6歳から 17歳以下の子供のみがいる=2、 6歳未満の子供と 6歳から 17歳以下の子供がいる=3

18歳未満の子供がいない=4

paocf1 6歳未満の子供のみがいる=1、その他=0

paocf2 6歳から 17歳以下の子供のみがいる=1、その他=0

paocf3 6歳以下の子供と、6歳から 17歳以下の子がいる=1、その他=0

citizen アメリカ生まれである=1、アメリカの自治領生まれである(プエルトリコ、グアムなど)=2、

アメリカ以外でアメリカ人の親または両親から生まれた=3、帰化によりアメリカ国籍となった=4、

アメリカ国籍でない=5

citizen0 アメリカ国籍である=1、その他=0

msp 対象外(15歳未満)=0、結婚していて配偶者が世帯にいる=1、結婚しているが、配偶者が世帯にいない=2、

未亡人で再婚していない=3、離婚していて、再婚していない=4、法律上の別居中=5、一度も結婚していない=6

msp1 結婚していて、配偶者が世帯にいる=1、その他=0

msp2 結婚しているが、配偶者が世帯にいない=1、その他=0

msp3 未亡人で再婚していない=1、その他=0

msp4 離婚していて、再婚していない=1、その他=0

msp5 法律上の別居中=1、その他=0

white 白人系=1、その他=0

black アフリカンアメリカン系=1、その他=0

asian アジア系=1、その他=0

engabil 英語以外の言語を話す者の英語能力に関して対象外(英語しか話さない)=0、とてもよい=1、よい=2、

あまり出来ない=3、全く出来ない=4

educ 学歴に関して対象外(3歳未満)=0、まだ学校に登校していない=1、幼稚園から 4th Gradeまで=2、

5th Gradeか 6th Grade=3、7th Gradeか 8th Grade=4、9th Grade=5、10th Grade=6、11th Grade=7、

12th Gradeで高校を卒業していない=8、高卒=9、1年未満の大学=10、1年以上の大学、学位無し=11、

Associate degree(準学士)=12、Bachelor’s degree(学士)=13、Master’s degree(修士)=14、

Professional degree(職業専門学位)=15、Doctorate degree(博士)=16

educ1 高卒未満=1、その他=0

educ2 高卒=1、その他=0

educ3 大学中退 or短大卒業=1、その他=0

educ4 大学卒業=1、その他=0

educ5 修士修了 or専門学位=1、その他=0

esr 対象外(16歳未満)=0、就業者で働いている(従業者)=1、就業者だが休職中(休業者)=2、

失業者=3、軍で働いている=4、軍で働いているが休職中=5、非労働力=6

esrx 就業者で働いているあるいは、軍で働いている(従業者)=1、その他=0

sex 男性=1、女性=2

表 1 変数と意味*3

– 4/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 5: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

1 2項選択問題 1.4 実証分析

Coefficient Std. Error z-Statistic Prob.

C 0.8894 0.3843 2.3141 0.0207

AGE 0.0011 0.0073 0.1431 0.8862

WHITE 0.4058 0.0678 5.9874 0.0000

BLACK 0.2446 0.0767 3.1892 0.0014

ASIAN −0.0991 0.0944 −1.0502 0.2936

PAOCF1 −0.7749 0.0566 −13.6912 0.0000

PAOCF2 −0.1726 0.0659 −2.6201 0.0088

PAOCF3 −0.7467 0.0613 −12.1781 0.0000

MSP1 −0.1638 0.0524 −3.1271 0.0018

MSP2 −0.3233 0.1027 −3.1478 0.0016

MSP3 −0.8998 0.2852 −3.1554 0.0016

MSP4 0.1231 0.0915 1.3444 0.1788

MSP5 −0.0990 0.0964 −1.0268 0.3045

CITIZEN0 0.4990 0.0567 8.8018 0.0000

EDUC1 −1.7001 0.3111 −5.4640 0.0000

EDUC2 −0.9772 0.3087 −3.1661 0.0015

EDUC3 −0.4127 0.3083 −1.3386 0.1807

EDUC4 −0.1611 0.3089 −0.5216 0.6020

EDUC5 0.1677 0.3132 0.5354 0.5924

表 2 2項ロジットモデルの推定結果 1

McFadden R-squared 0.10386 Mean dependent var 0.643255

S.D. dependent var 0.479057 S.E. of regression 0.447095

Akaike info criterion 1.170609 Sum squared resid 2617.409

Schwarz criterion 1.181449 Log likelihood −7656.097

Hannan-Quinn criter. 1.174229 Restr. log likelihood−8543.414

LR statistic 1774.634 Avg. log likelihood −0.583856

Prob(LR statistic) 0

表 3 2項ロジットモデルの推定結果 1

観測値

0 1 合計

予測値0 1848 1202 3050

1 2830 7233 10063

合計 4678 8435 13113

表 4 2項ロジットモデルの推定結果 1:分割表(的中率 69.25%)

– 5/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 6: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

1 2項選択問題 1.5 データの読み込み方

1.5 データの読み込み方

1. 新たにWorkfileを作る。「File」-「New」-「Workfile」をクリックする。

2. 以下のように入力し、「OK」をクリック。

・Workfile structure type Unstructured - Undated

・Observations 191433

3. 以下の画面が出る。

– 6/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 7: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

1 2項選択問題 1.5 データの読み込み方

4. csvファイルからデータを読み込む。Workfile画面で「Proc」-「Import」-「Read Text-Lotus-Excel」を

クリック。Text–ASCIIのタブを指定して、PC内に保存してある csvファイル ny.csvを指定すると以

下のような画面が出る。

5. 今回は系列を 21列(21個の縦ベクトル)読み込みたいので以下のように入力する。

・Name for series or Number if named in file21 *4

・Data order… in Columns*5

・# of headers before data 1 *6

・delimiters Commaにチェックを入れる*7

*4 21列読み込む。*5 列(縦ベクトル)を読み込みたいので in Columnsを選択。*6 ファイルの 1行目は変数名が入っているので 1と記入する。*7 csvファイルは Commaで区切られているので、Commaにチェックを入れる

– 7/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 8: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

1 2項選択問題 1.5 データの読み込み方

6. 以下のような画面が出れば読み込み完了。

– 8/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 9: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

1 2項選択問題 1.6 データの加工

1.6 データの加工

1. 2項ロジットモデルで分析しやすいようにデータを加工する。Workfileで「Genr」をクリックする。ダ

イアログが出るので以下のように記入し OKをクリック。以下のように入力して、esr=1または esr=4

のとき 1、その他のときは 0の値をとる esrxという変数を作る。新たに esrxが作成される。

・Enter equation esrx = esr = 1 or esr = 4*8

2. 同様にして他の変数も作る。Workfileで「Genr」をクリックして、ダイアログにそれぞれ以下のように

入力する。

*8

esrx=

{1 if esr = 1 or 4

0 otherwise

という指定。orは「和集合 ∪」を意味する。*9

citizen0=

{1 if citizen ̸= 5

0 otherwise

という指定。<>は not equalを意味する。*10

educ1=

{1 if educ≤ 8

0 otherwise

という指定。*11

educ3=

{1 if 10 ≤ educ≤ 12

0 otherwise

という指定。andは「積集合 ∩」を意味する。*12

educ5=

{1 if educ= 14 or 15

0 otherwise

という指定。

– 9/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 10: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

1 2項選択問題 1.6 データの加工

・Enter equation citizen0=citizen<>5*9

・Enter equation paocf1=paocf=1

・Enter equation paocf2=paocf=2

・Enter equation paocf3=paocf=3

・Enter equation msp1 =msp =1

・Enter equation msp2 =msp =2

・Enter equation msp3 =msp =3

・Enter equation msp4 =msp =4

・Enter equation msp5 =msp =5

・Enter equation educ1 =educ<=8 *10

・Enter equation educ2 =educ =9

・Enter equation educ3 =educ>=10 and educ<=12 *11

・Enter equation educ4 =educ =13

・Enter equation educ5 =educ =14 or educ =15*12

 

– 10/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 11: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

1 2項選択問題 1.7 2項ロジット分析

1.7 2項ロジット分析

1. 被説明変数を esrx、説明変数を age、 white、 black、 asian、 paocf1、 paocf2、 paocf3、 msp1、 msp2、 msp3、 msp4、 msp5、 citizen0、 educ1、 educ2、 educ3、 educ4、 educ5として以下のような 2項ロジットモデルで女性の就業状態についての分析を行う。

P {esrxi = 1|agei, whitei · · · } =exp {c + β1agei + β2whitei + · · · }

1 + exp {c + β1agei + β2whitei + · · · }

2. 2項ロジットモデルで分析する標本を指定する。今回は 25歳から 34歳までの女性を対象に分析にす

る。Workfileで「Sample」をクリックする。ダイアログが出るので以下のように記入し OKをクリッ

ク。

・Sample range pairs @all*13

・IF condition sex= 2 and age>= 25 and age<= 34

3. 「Quick」-「Estimate」をクリック。Methodで「BINARY」を選択する。以下のような画面が現れる。

4. 下記のように記述する。その他はデフォルトのまま。

*13すべての範囲を使うという指示。

– 11/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 12: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

1 2項選択問題 1.7 2項ロジット分析

・Equation specification esrx c age white black asian paocf1 paocf2 paocf3

msp1 msp2 msp3 msp4 msp5 citizen0 educ1 educ2 educ3 educ4 educ5

・Binary estimation method Logit をチェック

5. 下記の結果が出力される。

– 12/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 13: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

1 2項選択問題 1.7 2項ロジット分析

6. 分割表を見る。推定結果を開いている状態で「View」-「Expectation-Prediction Evaluation」をクリック

する。ダイアログがであるので以下のように記入する。

・Success of probability is greater than0.5

7. 以下のような結果が出力される。

– 13/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 14: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

1 2項選択問題 1.8 2項プロビット分析

1.8 2項プロビット分析

この節では、2項プロビット分析について述べる。EViewsの操作としてはほぼ 2項ロジット分析と同じで

ある。

1. 被説明変数を esrx、説明変数を age、 white、 black、 asian、 paocf1、 paocf2、 paocf3、 msp1、 msp2、 msp3、 msp4、 msp5、 citizen0、 educ1、 educ2、 educ3、 educ4、 educ5として以下のような 2項プロビットモデルで女性の就業状態についての分析を行う。

P {esrxi = 1|agei, whitei · · · } =∫ {c+β1agei+β2whitei+··· }

−∞

1√2π

e−t22 dt

2. 2項プロビットモデルで分析する標本を指定する。今回は 25歳から 34歳までの女性を対象に分析にす

る。ロジットの場合と同様に設定を行う。

3. 「Quick」-「Estimate」をクリック。Methodで「BINARY」を選択する。以下のような画面が現れる。

4. 下記のように記述する。その他はデフォルトのまま。

・Equation specification esrx c age white black asian paocf1 paocf2 paocf3

msp1 msp2 msp3 msp4 msp5 citizen0 educ1 educ2 educ3 educ4 educ5

・Binary estimation method Probit をチェック

– 14/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 15: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

1 2項選択問題 1.8 2項プロビット分析

5. 下記の結果が出力される。

– 15/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 16: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

1 2項選択問題 1.8 2項プロビット分析

6. 分割表を見る。推定結果を開いている状態で「View」-「Expectation-Prediction Evaluation」をクリック

する。ダイアログがであるので以下のように記入する。

・Success of probability is greater than0.5

7. 以下のような結果が出力される。

– 16/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 17: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

2 順序選択問題

2 順序選択問題

2.1 順序選択問題

本節では、被説明変数が有限個の値をとり、その順序がついている場合(順序選択問題)について述べる。

例えば、通勤手段としてどの交通手段(バス、電車、飛行機、徒歩、自家用車)を選ぶかという問題など、被

説明変数が有限の値をとるが、被説明変数の順序がつけられない問題は一般に多項選択問題となる。その場合

は、多項ロジットや多項プロビットなどを用いて分析することが多い。

順序選択モデルは、一般的に被説明変数 y は連続的な値をとるが、観測されない以下のような潜在変数 y∗

で定義づけられる。

y∗i = x⊤

i β + ui, i = 1, · · · , n

ただし、xi = (1, x1,i, · · · , xk,i)⊤ は説明変数で、β = (β0, β1, · · · , βk)⊤ はその係数とする。また誤差項 uは

i.i.d.で平均 0、分散が定数の確率分布関数 F に従うと仮定する。

連続潜在変数 y∗ は観測されないが、離散変数 y1, y2, · · · , yJ は観測される。y∗i と yi の関係を以下のように

定める。

以下のような閾値(threshold)を仮定する。

yi =

1 κ0 < y∗

i ≤ κ1

2 κ1 < y∗i ≤ κ2

......

J κJ−1 < y∗i < κJ

J + 1 個の一定ではあるが未知の閾値パラメーター κ0, κ1, · · · , κJ を用いることによって、試行の結果

(outcome)は y∗i で表現される実数上を J 個の区間に分割することで得られる。

yi = 1 if and only if κ0 < y∗i ≤ κ1 ⇔ κ0 − x⊤

i β < ui ≤ κ1 + x⊤i β

yi = 2 if and only if κ1 < y∗i ≤ κ2 ⇔ κ1 − x⊤

i β < ui ≤ κ2 + x⊤i β

...

yi = 3 if and only if κJ−1 < y∗i ≤ κJ ⇔ κJ−1 − x⊤

i β < ui ≤ κJ + x⊤J β

ただし、実数上をすべてカバーするために κ0 = −∞、κJ = ∞とする。このとき、未知の閾値が減り J − 1

個となる。ここで、yi が j である確率を考える。

πij = P (yi = j|xi)

= F (κj − xiβ) − F (κj−1 − xiβ) , j = 1, · · ·J (4)

κ0 = −∞、κJ = ∞であったので、F (−∞) = 0、F (∞) = 1となる。

F がロジスティック分布に従うと仮定した場合は順序ロジットモデル、標準正規分布に従うと仮定したとき

場合は順序プロビットモデルとなる。

– 17/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 18: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

2 順序選択問題 2.2 順序ロジットモデル

2.2 順序ロジットモデル

(4)で F がロジスティック分布に従うと仮定する。

πij = P (yi = j|xi)

= Λ(κj − x⊤

i β)− Λ

(κj−1 − x⊤

i β)

ただし、Λ(z) = exp(z)1+exp(z) はロジスティック分布の確率分布関数とする。このとき、対数尤度関数は以下のよ

うに与えられる。

lnL (β, κ1, · · · , κJ−1; y, x) =n∑

i=1

J∑j=1

dij ln(Λ

(κj − x⊤

i β)− Λ

(κj−1 − x⊤

i β))

尤度関数(あるいは対数尤度関数)を最大化するようにパラメーターを β̂ および κ1, · · · , κJ−1 を推定(最尤

法)する。

2.3 順序プロビットモデル

(4)で F が標準正規分布に従うと仮定する。

πij = P (yi = j|xi)

= Φ (κj − xiβ) − Φ(κj−1 − xiβ)

ただし、Φ(z) =∫ z

−∞1√2

exp{

12 t2

}dtは標準正規分布の確率分布関数とする。このとき、対数尤度関数は以

下のように与えられる。

lnL (β, κ1, · · · , κJ−1;y, x) =n∑

i=1

J∑j=1

dij ln(Φ

(κj − x⊤

i β)− Φ

(κj−1 − x⊤

i β))

尤度関数(あるいは対数尤度関数)を最大化するようにパラメーターを β̂ および κ1, · · · , κJ−1 を推定(最尤

法)する。

2.4 実証分析

2.4.1 データ

2項選択問題と同じく、アメリカの国勢調査の 1%サンプリングデータを用いて、ニューヨーク州の 30歳以

上の英語以外の言語を用いる者の英語能力に関する分析を行った。データはマイクロデータ(micro data:個

票データ、非集計データとも呼ばれる)である。データの出所は U.S. Census Bureau(国勢調査局)の Census

2000 data(2000年国勢調査)の 1-Percent Public Use Microdataである*14。分析に用いた変数の意味などは表

1を参照。

今回は、30歳以上の英語以外の言語を用いる者の英語能力に関する分析を行った。標本数は 26510である。

*14今回、分析で用いたデータは http://www.census.gov/Press-Release/www/2003/PUMS.html から入手可能である。

– 18/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 19: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

2 順序選択問題 2.5 データの読み込みと加工

2.5 データの読み込みと加工

2項選択問題と同様の手順であるので省略する。

2.6 順序ロジットモデル

1. 被説明変数を engabil、説明変数を age、 white、 black、 asian、 earns、 educ1、 educ2、 educ3、 educ4、 educ5、 citizen0、 msp1、 msp2、 msp3、 msp4、 msp5として以下の

ような順序ロジットモデルで 30歳以上の英語以外の言語を用いる者の英語能力についての分析を行う。

P {engbili = j|agei, whitei · · · } =exp {κj − (β1agei + β2whitei + · · · )}

1 + exp {κj − (β1agei + β2whitei + · · · )}

− exp {κj−1 − (β1agei + β2whitei + · · · )}1 + exp {κj−1 − (β1agei + β2whitei + · · · )}

2. 順序ロジットモデルで分析する標本を指定する。今回は 30歳以上の英語以外の言語を用いる者を対象

に分析にする。Workfileで「Sample」をクリックする。ダイアログが出るので以下のように記入し OK

をクリック。

・Sample range pairs @all*15

・IF condition engabil=> 1 and age>= 30

3.「Quick」-「Estimate」をクリック。Methodで「ORDERED」を選択する。以下のような画面が現れる。

*15すべての範囲を使うという指示。

– 19/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 20: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

2 順序選択問題 2.6 順序ロジットモデル

4. 下記のように記述する。その他はデフォルトのまま。

・Equation specification engabil age white black asian earns

educ1 educ2 educ3 educ4 educ5 citizen0 msp1 msp2 msp3 msp4 msp5*16

・Error Distribution Logit をチェック

*16 順序ロジットモデルの場合、定数項を入れると閾値が定まらなくなるので定数項を入れない。

– 20/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 21: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

2 順序選択問題 2.6 順序ロジットモデル

5. 下記の結果が出力される。

– 21/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 22: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

2 順序選択問題 2.7 順序プロビットモデル

6. 評価を見る。推定結果を開いている状態で「View」-「Prediction Evaluation」をクリックする。以下の

ような結果が出力される。

2.7 順序プロビットモデル

1. 被説明変数を engabil、説明変数を age、 white、 black、 asian、 earns、 educ1、 educ2、 educ3、 educ4、 educ5、 citizen0、 msp1、 msp2、 msp3、 msp4、 msp5として以下のよ

うな順序プロビットモデルで 30歳以上の英語以外の言語を用いる者の英語能力についての分析を行う。

P {engbili = j|agei, whitei · · · } =∫ κj−(β1agei+β2whitei+··· )

−∞

1√2π

e−t22 dt

−∫ κj−1−(β1agei+β2whitei+··· )

−∞

1√2π

e−t22 dt

2. 順序プロビットモデルで分析する標本を指定する。順序ロジットと同じなので省略。

3.「Quick」-「Estimate」をクリック。Methodで「ORDERED」を選択する。以下のような画面が現れる。

– 22/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 23: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

2 順序選択問題 2.7 順序プロビットモデル

4. 下記のように記述する。その他はデフォルトのまま。

・Equation specification engabil age white black asian earns

educ1 educ2 educ3 educ4 educ5 citizen0 msp1 msp2 msp3 msp4 msp5*17

・Error Distribution Normal をチェック

*17 順序プロビットモデルの場合、定数項を入れると閾値が定まらなくなるので定数項を入れない。

– 23/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 24: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

2 順序選択問題 2.7 順序プロビットモデル

5. 下記の結果が出力される。

– 24/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.

Page 25: EViews の使い方 第 7 章 離散選択問題 - Google Sites · 2010-06-16 · 1 2 項選択問題 1 2 項選択問題 1.1 2 項選択問題 被説明変数yi が0 と1 の2 値(バイナリー)しかとらない場合、通常のOLS

2 順序選択問題 2.7 順序プロビットモデル

6. 評価を見る。推定結果を開いている状態で「View」-「Prediction Evaluation」をクリックする。以下の

ような結果が出力される。

– 25/25–

EViewsマニュアル

Copyright © 2008 Konishi and Itoh. All rights reserved.