世帯マイクロデータの適合度評価における 重みの決定手法

Preview:

DESCRIPTION

世帯マイクロデータの適合度評価における 重みの決定手法. 東京都市大学 大谷紀子 ( 株 ) ドーコン 杉木 直 東京都市大学 宮本和明. 土地利用マイクロシミュレーション. 土地利用と交通の詳細な変化の記述方法 初期年次のマイクロデータが必要 各世帯の世帯人数,世帯構成員の年齢,性別 etc. 実際のデータの入手は困難 推定データの作成 推定手法の妥当性は?. 観測 データ B. 推定データ E 1. 推定データ E 2. 観測データを利用した適合度評価. 異なる推定手法の再現性能の比較評価. 適合度. 適合度. 適合度の高い推定データの作成手法. - PowerPoint PPT Presentation

Citation preview

1

世帯マイクロデータの適合度評価における重みの決定手法

東京都市大学 大谷紀子( 株 ) ドーコン 杉木 直東京都市大学 宮本和明

土地利用マイクロシミュレーション

土地利用と交通の詳細な変化の記述方法初期年次のマイクロデータが必要

各世帯の世帯人数,世帯構成員の年齢,性別 etc.

実際のデータの入手は困難

推定データの作成

推定手法の妥当性は?

観測データを利用した適合度評価

観測データ B適合度 適合度

推定データ E1 推定データ E2

異なる推定手法の再現性能の比較評価

適合度の高い推定データの作成手法

観測データがない場合の推定手法として有効

4

対象属性とデータ間距離

対象属性 データ表現 データ間距離

世帯構成員

年齢20 次元ベクトル

ユークリッド距離

性別世帯主との関係

住宅タイプ2 次元ベクトル

マンハッタン距離

居住ゾーン ゾーン番号 時間距離自動車保有台数 台数 + 1 対数差世帯所得 所得 差

推定データの適合度

5 種のデータ間距離の正規化平均の重み和 dsum

推定データの適合度 = dsum の最小値5

mcrha

mcrhawwwww

ddiswldiswtdiswmdiswediswdsum

観測データ

推定データ

重み設定

6

属性ごとに要求される推定精度

シミュレーションの目的により変動

各属性を重視する度合いに応じて重みを設定設定の基準は???

本研究の目的重み設定の目安の提示

重み設定指標の提案

属性の影響力

7

観測データB

改変観測データ Bz

政策変数 V 政策変数 Vz

属性 z について

属性値を変更

マイクロシミュレーション

の適合度に対するの相違との影響力属性z

z

BBVVz

観測データB’

改変観測データ Bz’

の適合度に対するの適合度に対するの影響力属性

z

z

BBBBz ''

重み基準値

8

z zattzattzwbase)()()(

重み基準値

全属性を同等に考慮重み=重み基準値

属性ごとに重視度合を変動重み=重み基準値 × 属性の重視度合

9

算出例

3 属性に関する改変観測データ集合を生成 5 年後を予測するマイクロシミュレーション 算出結果

属性適応度 F1

重み= 1 影響力適応度 F2

重み=重み基準値F2/F1

世帯構成員の年齢・性別

0.251 1.025 0.313 1.247自動車

保有台数0.174 1.127 0.250 1.437

世帯収入 0.160 1.205 0.237 1.481

10

まとめ

適合度算出における重み決定の目安の提示重み決定指標の提案

属性の影響力 重み基準値

影響力に応じた適合度算出が可能

11

12

年齢・性別・世帯主との関係

構成員カテゴリ本人男 本人女 妻  息子の妻 その他1男息子1 娘1  父  兄弟   その他2男 息子2 娘2  母  姉妹   その他1女息子3 娘3  孫男 孫女   その他2女

データ表現 世帯構成員の年齢を成分とする 20 次元ベク

トル 構成員不在の成分 → 999

データ間距離 edis2 ベクトル間のユークリッド距離

45 歳の父親, 42 歳の母親, 15 歳の息子, 12 歳の娘の世帯のデータ

(45, 15, 999, 999, 42, 12, 999, 999, …)

住宅タイプ

住宅タイプの分類 持ち家 or 賃貸 戸建 or 集合

データ表現 賃貸・集合を軸とする

2 次元ベクトルデータ間距離 mdis

2 ベクトル間のマンハッタン距離

13

組合せ 4種+その他=計 5種

賃貸

集合

持ち家・戸建

持ち家・集合

賃貸・集合

賃貸・戸建

01

1

2

2その他

0

居住ゾーン・自動車保有台数・世帯所得

居住ゾーンのデータ間距離 tdis 2 ゾーン間の時間距離

自動車保有台数のデータ間距離 ldis log (自動車保有台数+ 1 )の差

世帯所得のデータ間距離 ddis 世帯所得の差

14

15

適合度計算における問題点

観測データ

推定データ

データ数が N のとき世帯番号ペアは N! 通

組合せ爆発!共生進化の適用

距離和が最小となるデータの組合せの探索世帯番号ペ

共生進化

遺伝的アルゴリズムの一手法 生物の進化を模倣した最適解探索アルゴリズム

同種個体の協働による目標の達成解を部分解の組合せで表現部分解集団と全体解集団の並行進化局所解への収束を回避

遺伝的アルゴリズム

生物の進化を模倣した最適解探索アルゴリズム 問題に対する解を染色体で表現

100 10 1 01 0 10 0

101 00 1 10 0 01 0

100 10 0 01 0 10 1

・・

個体集団

100 10 1 01 0 10 0

101 00 1 10 0 01 0親個体

100 10 1 1

10 01 0

子個体 100 10 1 1 10 01 0

交叉

突然変異

100 10 1 10 0 01 0

101 00 10

00 10 0

101 00 1000 10 0

101 00 1 00 10 00

局所解への収束が問題

部分解

全体解

18

部分解と全体解の表現

推定データの世帯番号観測データの世帯番号

世帯番号ペア 1

・・・

世帯番号ペア 2 世帯番号ペア Lp

部分解集団

Lw個

Recommended