Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
農業
炭素排出(燃料消費、森林⽕災など)
⽣物・⽣態系
健康・疾病
都市・交通
⽔利⽤・流域環境
⼈間活動がさまざまな分野をつなぐ
⼈⼝分布
⼟地利⽤(空間利⽤)
⼈⼝属性
移動・⽴ち⼊り
現在・未来
ケニアにおけるマラリア感染拡⼤の分析移動労働者のトレンド
マラリア感染のホットスポット
マラリア感染の地理的トレンドの分析 医療施設、検査活動の戦略的配置
Science. 2012 Oct 12;338(6104):267‐70. doi: 10.1126/science.1223467.Quantifying the impact of human mobility on malaria.Wesolowski A1, Eagle N, Tatem AJ, Smith DL, Noor AM, Snow RW, Buckee CO.
拡散元
拡散先
2014-07-24SHIBASAKI & SEKIMOTO LAB. UTOKYO. 8
⼈の流れを表すデータ
パーソントリップ調査(PT調査) 都市交通計画調査として⾏われる
平常時1⽇分の移動に関するアンケート調査
GPSデータ 携帯GPSや⾞載GPS機器などから得られる
時間連続で詳細な位置情報データ
CDRs(Call Detail Records: 基地局通信履歴) 携帯電話利⽤時(通信時)に基地局側に記録される通
信実績情報(基地局の位置情報)
And more …
レファレンスデータ(国内の主要都市圏は全て)(海外は、ジャカルタ、マニラ等)
スマホの普及により、利⽤可能性が急速に拡⼤より、正確。しかし、端末にソフトを⼊れる必要
世界的にどこでも利⽤可能端末側にソフトを⼊れる必要なし。
Powered by some open source products
PostgreSQL PostGIS pgRouting hadoop OSM
Home
A Sta.B Sta.
Work Place
Home
A Sta.
B Sta.
Work Place
Home
A Sta.
B Sta.
Work Place
徒歩
鉄道
07:00, Lon, Lat
07:10, Lon, Lat
07:40, Lon, Lat
07:50, Lon, Lat徒歩
07:15, Lon, Lat07:25, Lon, Lat07:30, Lon, Lat
07:35, Lon, Lat
07:40, Lon, Lat(2) 移動経路の推定
経路探索/経路マッチング(3) 単位時間毎の位置推定
時間・速度の推定(1) 滞在地点(発着地点)の推定ジオコーディング/クラスタリング
⼈の流れのデータソース
経路
推定
推定された⼈々の流動
InputResult
時空
間内
挿
⼈の流れの推定:アウトライン
アンケート調査 GPSデータ
CDRデータ
経路データ測位点補正点
経路データ測位点内挿点
観測誤差の補正▶�経路マッチング道路、建物など、測位点の近傍位置へ補正
⽋損区間の補間▶�経路探索所要時間や距離で最短経路探索し候補を得る
移動経路の推定 ⽋損区間は補間・観測誤差には補正
必要となるインフラデータ
道路ネットワークデータ(DRM, OSM, …) 鉄道ネットワーク・時刻表データ
2014-07-31SHIBASAKI & SEKIMOTO LAB. CSIS/EDITORIA. UTOKYO. 13
CDRs(Call Detail Records)とは 通信インフラの障害検出や,通話料⾦算出の基礎になる携帯電話通信の履歴情報
CDRsの特徴 記録されるのは通信の開始終了⽇時(通話時間)と接続した基地局の位置情報 データの時間解像度は個⼈の利⽤状況に依存(スマートフォンでは⽐較的細かい) 基地局の位置情報のため空間解像度は粗い(半径数km程度) 携帯電話利⽤者全体のデータが記録されている.
青:CDRs赤:GPS
半径 約 4 km青:CDRs 赤:GPS
CDRs の特徴
アウトライン
(1) CDRsの位置情報をクラスタリングし滞在地点を推定 Mean Shift法によるクラスタリング
(2) 滞在地点間の移動パターンを作成し,移動経路を⽣成 道路・鉄道の両⽅の経路を組み合わせる
(3) 実際のCDRs観測値に対して最尤法で経路を選択
滞在地点の推定
移動パターン抽出
候補経路の⽣成(経路形状)
経路形状の特定
移動時間パターンの⽣成
移動経路の時空間パターンを特定 CDRデータ
CDRs からの経路推定(概要)
CDR{ X, Y, T }
経路推定結果
推定滞在地点
(×)道路最短経路ではない
(○)鉄道最短経路が尤もらしい
森林火災?
2002
80‐km radius
2005
40‐km radius
森林火災の発生頻度と道路や土地利用、携帯電話基地局分布との予備的分析
平成26年度:火災の頻発地域(カンボジア?)におけるより詳細な分析
CDRデータの属性推計
本研究の目的
• 匿名化されたCDRデータからデモグラフィックな属性を推計する• 推計手法の一般化
手法
• フィールド調査による二次的データと組合せて、匿名化されたCDRの属性(性別・職業・年齢層)を推計する
• 検証用データを収集し、推計モデルの評価を行う
本研究の意義
• CDRを用いた研究の大半は人間の行動パターンや流動分析で
あるが、それらに属性情報を付与することができれば、特定の人口層に対する政策介入などに役立てることができ、データの利用価値が飛躍的に向上
二次的データの収集①:SPACE調査
調査期間・対象地
• ダッカ(CDRがカバーするエリアと同一)• 2013年11〜12月(準備:9月〜、データセット完成2月)
*居住、商業、工業エリアの3分類** 居住建物の設備と規模のクライテリアを設けることでスラムを含む4段階に分類
調査項目
• 携帯ユーザー以外を含む世帯メンバーの属性• 一週間の行動パターンと主要活動時間帯• 携帯電話の所有・使用パターン• 1日分の携帯電話使用履歴とその日のスケジュール
サンプリング
• グラミンフォンユーザーを含む810世帯(922ユーザー)• 土地利用分類と収入レベルによる二段階層化抽出
二次的データの収集②:検証用データ
データの内容
• 2013年8月2014年1月までの5ヶ月分のCDR• 性別、年齢、職業、自宅と職場の位置(ward番号レ
ベル)などの属性情報(電話番号は含まない)
対象
• グラミンフォンユーザー58名
※データがカバーする時期のダッカの状況と補助データの収集
• 2013年9月から2014年2月にかけて政府への反対運動としてホルタル(ゼネスト)が断続的に発生
• CDRデータのカバーする期間のうち、SPACE調査がカバーする
期間についてはイベントログを作成した(行動パターンの異常値の評価、確認用)
primary activity dayのcalling behavior電話を発信する場所の男女比較(SPACEデータ)
020406080
100
Group (1) Group (2) Group (3) Group (4) Group (5)
Male
Female
一日の発信数に自宅からの発信数が占める割合(%)
一日の発信数に職場・学校からの発信数が占める割合(%)
グループ(2), (3), (5)では
女性が自宅から電話をかける割合が男性に比べて圧倒的に多い
グループ(2), (3), (5)では
男性が職場・学校から電話をかける割合が女性に比べて圧倒的に多い
020406080
100
Group (1) Group (2) Group (3) Group (4) Group (5)
Male
Female発信場所を比較すると、primary activity dayの
calling behaviorの男女差は顕著
推計モデルの課題
1. 自宅エリアの推計精度が、モデルの主要特徴量に大きく影響
場所ラベルの推計精度を改善することが、モデルの推計精度を上げるための鍵となる
2. 場所の再訪率に着目したした行動モデル分析によると、人間の行動パターンのルーティンインターバルは24、36、72時間に分類できるとされている*が、本モデルでは、働いているかそうでないかという、おおまかな分類でしかルーティンを捉えていない
個々のルーティンインターバルの抽出方法を検討する必要がある。例えば、自宅以外の主要な再訪場所の確率分布など。
* 出典Gonzalez, M. C., Hidalgo, C. A., & Barabasi, A. L. (2008). Understanding individual human mobility patterns. Nature, 453(7196), 779‐782.