Upload
masabumi-furuhata
View
94
Download
2
Embed Size (px)
Citation preview
パナマ文書解析のためのNeo4j と Tableau の初期設定
2016/6/29古幡征史
Masabumi Furuhata
はじめに
• ゴール: Tableau を利用してパナマ文書解析用の設定をできるようにする。
• 利用するもの:– 可視化ツール : Tableau 10– グラフデータベース: Neo4j 3.01– コネクタ: Tableau Web Data Connector
WDC
Cypher query
Neo4j とパナマ文書の入手• Neo4j で読み込める形式のデータを利用 (csv 版もある )• 以下のサイトの windows version を利用
– https://www.occrp.org/en/panamapapers/database• 自分が利用していたのは panama-papers-windows-2016-05-17.zip• 展開して、インストールすると Neo4j を利用して分析できる。• panama-papers-windows フォルダの中の Launch Neo4j で起動
– 1. panama paper がある folder を指定 \panama-papers-windows-2016-05-17\panama-papers-windows\neo4j.data\panama.graphdb
– 2. start ボタンを押す
1 choose panama paper folder
2 press start
Neo4j を起動• ブラウザで以下にアクセス
– http://localhost:7474/browser/• 以下の画面が立ち上がるので、パスワードなどを設定
して Cypher Query 言語でグラフデータベースにアクセス
Neo4j を起動• Database Information をクリックすると登録されて
いる Node Labels と Relation Types が表示される
Neo4j でクエリ実行• ノード数を調べてみる
– MATCH (n) RETURN count(n);– () でくくられているのは、ノードに対する指定– 以下のように約84万ノードと返ってくる
Neo4j でクエリ実行• ノード間のネットワーク関係を調べる
– MATCH (n1:Officer)-[r]-(n2:Intermediary) RETURN n1, r, n2;– Officer ノードと Intermediary ノードでつながっているものを表示– [] でくくられているものはリレーション(エッジ)で、 ()-[]-() は
ノード間がエッジでつながっているもの– n1, r, n2 はクエリ内での変数名
Tableau の入手
• データ可視化用に Tableau を利用• 有償ソフト• 14 日間の無償トライアルもある• http://www.tableau.com/
Tableau Web Data Connector の入手
• Tableau と Neo4j を接続するために web data connector を以下の git から入手– https://github.com/ralfbecher/tableau-neo4j-wdc
• 起動– tableau-neo4j-wdc-master\website のフォルダにて、以下
の python スクリプトでサーバ起動 ( このフォルダのNeo4jWdc.html)
– python -m SimpleHTTPServer 8888– あるいは、 startHttpServer.bat をダブルクリックして起動
WDC 接続
• Tableau から Web Data Connector 経由で Neo4j に接続
• 接続>その他のサーバ> web データコネクタ
WDC 接続
• Web Data Connector で以下にアクセス– http://localhost:8888/Neo4jWdc.html
抽出条件の設定• 以下の画面が表示されるので、 Cypher Query を記述
してデータを取り出す• 例• MATCH (n1:Officer)-[r]-(n2:Intermediary) RETURN n1, r, n2;
Tableau で可視化の例
今後
• 分析に役立つ Query 条件の設定例• Tableau と連携させるべきこと、 Neo4j
内で完結すべきこと、その他のやり方のメリットをまとめる
• Tableau のメリット–地図情報が使いやすい