オープンデータカタログの先
ROIS&LODI 加藤 文彦
第5回 Code for Wakayama 和歌山県のGitHubについて考える会2015-06-28
加藤 文彦 (かとうふみひろ)
• (共)情報・システム研究機構 特任研究員
• 特定非営利活動法人 リンクト・オープン・データ・イニシアティブ 理事
• LODACプロジェクト
• DBpedia Japanese
• Open Park
• 共通語彙基盤
• CKAN
• Linked Data勉強会
• Linked Open Data チャレンジ Japan
http://www.data.go.jp/
データカタログの役割• 一次作成者・提供者
• ライセンス
• データアクセス方法
• ファイル形式
• データ種別
Q. データカタログって要るの?• A. 要るか要らないかで言えば要る
• データの一次配布元であることとライセンスの明示が大事
• 利用者が参照や比較等できる
• まず自治体のWebサイトに専用ページ作るので良い
• 専用ソフトウェアを使うとより便利にはなるが必須ではない
• 外部のWebサイトに置くのも良いが、それが一次配布元であることを自治体のWebサイトで明示してくれると安心
https://www.whitehouse.gov/developers
様々な課題• ファイル形式
• ファイル版管理
• 利用者との連携
課題1: ファイル形式• 広く受け入れらているもの > 独占的なもの
• テキスト > バイナリ
• CSV, JSON辺りがコンセンサス
• 但し例外もある
• 誰が担うのか?
課題2: ファイル版管理• 変更がありファイルを更新するとして
1.上書きをして常に最新のものだけ公開
2.以前のファイルも公開
3.変更履歴や差分も公開
• 利用者としては3のほうが嬉しい
課題3: 利用者との連携• フィードバック
• 応用例アイデア
• 応用例作成
GitHubはオープンガバメントを推進していく上で便利な基盤
何故 GitHub が使われるのか
何故GitHub?• これまでもコードレポジトリは色々あった
• SourceForge, Google Code, …
• プロジェクトが主役
• GitHub
• gitを使えるレポジトリは当時珍しかった
• 開発者が主役・開発者SNS
• gitを基盤としたfork & pull requestという協調開発モデルをサポート
• インターネット上で協調作業を行うのに必要なものが大体揃っている
• ソースコード以外にも使われるように
便利なツール群• 版管理: git, 可視化
• 協調作業: issue, pull request
• 情報共有・公開: wiki, GitHub Pages, 可視化
• 組織管理: organization
GitHubの可視化• 特定の形式のデータを載せると勝手に可視化してくれる
• データ公開者は利用者にもなるべき
前提: “オープン”• “オープン”は哲学であり考え方でありワークフローでもある
• 完璧さを求めずに出す
• 世界中のどこかで誰かが必要とするかもしれない
• 誰でも自由に使って良いが自己責任
• 勝手に追加・修正等してくれるかもしれない
• 全ての課題を解決する必要はない
• 適切に対話できると良い
• ある意味行政職員の従来の考え方とは真逆
• なるべく100%のものを出したい
• 問合せには答えなければいけない
進行段階1.出しっぱなし状態
• 現状これが多い
2.課題・問合せに対処
•軽微な指摘を修正したり変更を取り込んだり
3.協調開発
•案の段階から共有して皆で開発
うまく協調開発をしていくは 担当者が必要
– Ben
“行政の中に一人はわかっている人がいてその人がなんとかしている”
案1: 行政側にわかる人を作る• 雇う
• 直接雇用
• Code for JapanのFellowship
• 教育する
• 異動問題
案2: 業者に頼む• Webサイトのメンテナンスのように外部委託
• 業者側がGitHubに慣れている必要あり
案3: コミュニティに権限移譲• Code for Wakayamaのような外部の地域コミュニティに委ねる
• 行政は最初のデータや大きな更新に専念する
まとめ• GitHubはオープンガバメントを推進していく上で便利なプラットフォーム
• GitHubをうまく使うにはオープンソースコミュニティのアレコレを知っている担当者が必要
• 行政側も利活用を