46
地地地地地地地地 地地地地地地地地地地地 地地地地地地地地 地地 @i2k

地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

Embed Size (px)

Citation preview

Page 1: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

地場産業としてのオープンデータの可能性

国立情報学研究所大向 一輝

@i2k

Page 2: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

自己紹介

Page 3: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

オープンデータの例

http://www.tepco.co.jp/forecast/index-j.htmlhttp://www.kepco.co.jp/setsuden/graph/index.html

Page 4: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

オープンデータとは

•データを誰でも使えるように

• ウェブ上で公開

• 再利用しやすい形で

•本当に盛り上がっているのか?

•何が難しいのか?

Page 5: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

オープンデータの潮流

•世界のデータ公開

• アメリカ:政府情報のオープンデータ化に関する大統領令

• EU :公共セクター情報の再利用指令

• G8 :オープンデータ憲章

• 日本:電子行政オープンデータ戦略

•進捗の確認・ランキングOpen Data Index (WWWF)

Open Data Census (OKFN)

Page 6: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

日本のオープンデータ

•政府レベル

• Open DATA METI (経済産業省)

• 次世代統計利用システム(総務省・統計センター)

• 内閣官房データカタログ

• 重点 5 分野

• 白書、防災・減災、 地理空間情報、人の移動、予算・調達

• 制限

• 個人情報、安全保障に関わる情報、法令で取り扱いが定められた情報

Page 7: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

Open DATA METI

http://datameti.go.jp

Page 8: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

次世代統計利用システム

http://statdb.nstac.go.jp

Page 9: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

日本のオープンデータ

•地方自治体レベル

• データシティさばえ(福井県鯖江市)

• 千葉県流山市役所・市議会

• ビッグデータ・オープンデータ活用推進協議会(千葉市・奈良市・福岡市・武雄市)

• ・・・

• 主な公開データ

• 統計・地域情報・ GIS ・予算…

Page 10: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

データシティさばえ

http://www.city.sabae.fukui.jp/pageview.html?id=11552

Page 11: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

日本のオープンデータ

•草の根レベル

• 税金はどこへ行った?( 52 都市)

• Wikipedia タウン(横浜・二子玉川)

http://spending.jphttp://www.solabo.net/wiki0525/

Page 12: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

International Open Data Day

青森・会津若松・千葉・東京・横浜名古屋・東海・鯖江・福岡

Page 13: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

オープンデータとコミュニティ

•2 つのコミュニティ

• ハッカーと市民

•2 つのアクティビティ

• ハッカソンとアイデアソン

• オープンデータ・カレンダー

•CODE for AMERICA

• Civic tech/hack のコミュニティ

• 公共セクターへの技術者派遣

• 日本版 CODE for ***

Page 14: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

ライセンス

再利用可

非独占的

識別子

LOD

Page 15: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

ライセンス

•オープンライセンス

• 「 Open Definition 」に基づくライセンス

• 商用・非商用を問わない 2 次利用

• 出典の表示を求めてもよい

• Creative Commons または互換ライセンスがデファクトスタンダード

• CC-BY

• CC0

• ODC-by : Open Data Commons

Page 16: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

構造化

•中身の構造化

• 「ネ申 Excel 」問題

• コード・項目名の共通化

•データ群の構造化

• カタログサイト

• メタデータ・管理体制

•課題• ファイルか API か

• Data.gov の例

Page 17: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

作品

作品

図書

Linked Open Data

Page 18: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

友人

在住

人物

作品

作品

Linked Open Data

Page 19: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

舞台

観光地

観光地

観光

友人

在住作品

作品

Linked Open Data

Page 20: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

現実のデータ

同じ?

関係ある?

同じ?

Page 21: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

Linked Open Data の技術

•異なるデータベース上のデータ同士をつなぐ

• 識別する

• 同じものに同じアドレスをつける

• 関係づける

• リンクし、その意味(理由)を記述する

•ウェブの仕組みそのもの

• ウェブページとハイパーリンク

• 「文書のウェブ」から「データのウェブへ」

同じ!

Page 22: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

Linked Open Data (詳細)

著者

春陽堂 1907

出版者 出版年

テーマ

作家 N 作品 B

地域 M

dc:creator

dc:publisher dc:date

foaf:topic

  主語       述語      目的語http://library.jp/B dc:creator http://library.jp/Nhttp://library.jp/B dc:publisher 春陽堂http://library.jp/B foaf:topic http://visitor.jp/M

坊っちゃん

タイトルdc:title

夏目漱石名前

foaf:name

図書館サービスhttp://library.jp

観光サイトhttp://visitor.jp

Page 23: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

つながるデータ

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jenvtzsch. http://lod-cloud.net/ CC-BY-SA

Page 24: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

LOD の利点

•標準化による分業体制の確立

• データの書き方: RDF

• 分野のスペシャリストはデータの記述に集中

• データの取り出し方: SPARQL

• RDF ストアのクエリ言語

• データの抽出に独自プログラムを必要としない

• TXT ・ CSV ・ XLS ・ XML との相違点

• 開発者はアプリケーションに集中

• アプリに合わせてデータを作る

• 「逆マッシュアップ」

Page 25: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

DBpedia Japanese

http://ja.dbpedia.org

Page 26: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

DBpedia Japanese

<prop-ja:選手名 xml:lang="ja">藤浪 晋太郎</prop-ja:選手名 ><prop-ja: 出身地 xml:lang="ja"> 大阪府堺市南区</prop-ja: 出身地 ><prop-ja:打席 xml:lang="ja">右</prop-ja:打席><prop-ja:wikiPageUsesTemplate rdf:resource="http://ja.dbpedia.org/resource/Template:阪神タイガース " /><prop-ja: 所属球団 xml:lang="ja">阪神タイガース </prop-ja: 所属球団><prop-ja:背番号>19</prop-ja:背番号><prop-ja:身長>197</prop-ja:身長><prop-ja:生年月日 >1994-04-12</prop-ja:生年月日 ><prop-ja: 利き腕 xml:lang="ja">右</prop-ja: 利き腕><prop-ja:ドラフト順位 xml:lang="ja">ドラフト 1位</prop-ja:ドラフト順位><prop-ja:守備位置 rdf:resource="http://ja.dbpedia.org/resource/投手 " /><prop-ja: 経歴 xml:lang=“ja”>* 大阪桐蔭高等学校 * 阪神タイガース </prop-ja: 経歴><prop-ja: 体重 >86</prop-ja: 体重 ><prop-ja:年俸>1500</prop-ja:年俸>

Page 27: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

SPARQLエンドポイント

SELECT DISTINCT ?label ?birthYearWHERE { ?s <http://ja.dbpedia.org/property/生日> 1 ; <http://ja.dbpedia.org/property/生月> 1 ; <http://ja.dbpedia.org/property/生年> ?birthYear ; rdfs:label ?label .}ORDER BY ?birthYear

Page 28: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

プロ野球因縁サーチ

http://innen-search.com

Page 29: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

SPARQL Timeliner

http://uedayou.net/SPARQLTimeliner/

Page 30: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

地場産業としてのオープンデータ

•いますぐオープンデータだけで儲かるか?→ たぶん No

• 他のデータとの組み合わせ

•データのあるところに人は集まる

• ウェブ API ・ソーシャルメディア

• 人を呼び込むこと・注目を集めること

•「鯖江モデル」人口 5万人

• 行政と開発者の直接的な信頼関係

•「横浜モデル」人口 370万人

• 市民団体・ NPO との連携

•規模と状況はそれぞれ、それぞれの方法で

Page 31: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

地場産業としてのオープンデータ

•使う側から作る側へ

• 「情報の構造化」の専門家として

•データ提供側の「痛み」を知る

• 出したけど使われない

• 他の部署から反対される

• 具体的な「できない理由」と抽象的な「する理由」

•オープンデータならではの分業

• アプリ構築

• データ変換

• プラットフォーム提供

Page 32: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

データを公開しない理由( 1/5 )

•無関心

• 誰も気にしていない

• コミュニティからの支援が得られない(市民ハッカーがいない)

•混乱• 明確な事例がない

• データを何のために使うのかわからない

• どんなデータが必要とされるのかがわからない

• データを公開する前に、どんな便益があるか明確にしてほしい

• 今のシステムで十分だ

• 人々を混乱させるだけだ

Page 33: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

データを公開しない理由( 2/5 )

•困難

• とにかく複雑で難しい

• 大量のバックログを抱えている

• ついていけない、時間がない、変化が早すぎる

• データの量が膨大である

• 自分の時間の大部分が取られてしまう

•費用

• 予算がない

•スタッフ問題

• それは私の仕事ではない

• 私の上司や政治家はデータ公開を望んでいない

• やり方を知っている人がいない

Page 34: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

データを公開しない理由( 3/5 )

•合法性• データや記録を公開する法的な権限を持っていない

• このデータを公開すれば、市民は私たちを訴える

• 私たちはデータに対する権利を持っていない

• 私たちがデータの所有者なのかどうなのかわからない

• データは販売するべきである。もし売りたくなったらどうすればよいのか?すでに売っている

• 機密データではないが、公開することでよい PR になるとは思えない

• 私たちの弁護士は特別なライセンスを付与するべきだと言っている

• このデータを集めるのに、膨大な時間・人・資源を投入した

• なぜデータを必要としているのかを知りたいので、直接窓口に来てほしい

• 誰かがパッケージングし直して売り払ってしまうのではないか

• データをだれが利用して、何を行ったのかをコントロールしたい

• 連邦政府や他の政府機関がすでにデータをもっているので、そちらから入手して欲しい

Page 35: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

データを公開しない理由( 4/5 )

•正確さ

• データを一括して公開すると、だれかがそれを変更してしまう

• データを公開したりすると、私たちがハックされる

• データを公開すると、やり方によっては人々が誤解する危険がある

• 市民が混乱する、データの品質がそもそも高くない

•プライバシー

• プライバシー保護の懸念があり、データを公開できない

• もう既に公開している

• 窓口やプロバイダーを通じてすでに公開している

• 情報公開制度があるではないか

• すでに十分にデータは公開している

• API を提供しているではないか

• データポータルが必要なら、同じようなものはすでにある

Page 36: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

データを公開しない理由( 5/5 )

•その他

• データが優秀な技術者集団や高等教育を受けたコミュニティに利用されると、デジタルデバイド問題がさらに深刻化する

• 今、それは優先事項ではない

• それについてはペンディング状態だ、似たようなプロジェクトもすでに始まっている

出典 : Reasons to Not Release Data, Part 1-Part 10, Sunlight Foundation

(日本語訳 : 「公的機関がデータを公開しない理由」 Open Knowledge Foundation Japan )

Page 37: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

データの地産地消

•LODチャレンジ

•オープンデータのコンテスト

•アプリ部門・可視化部門・アイデア部門

•データ部門:データそのものを評価

•プラットフォーム部門:データを作る仕組みを評価

•MA9 シビックハック賞

Page 38: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

LODチャレンジ

http://lod.sfc.keio.ac.jp/

Page 39: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

受賞作品 – アプリケーション部門

•LinkData (http://linkdata.org/)

• テーブルデータを RDF 形式に変換・公開

• LOD 公開のインフラ

• CityData ・ LinkData App などの派生プロジェクト

Page 40: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

受賞作品 – データセット部門

•saveMLAK (http://savemlak.jp/)

• ボランティアによる社会教育施設(図書館・博物館・文書館・公民館)の被災情報共有

• 実質的に入手可能な唯一の施設リスト

Page 41: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

残念な日本地図

http://cheese-factory.info

Page 42: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

オープンデータを広げるために

•知る

• 日経オープンデータ情報ポータル

• NHK NEWS WEB

• Open Knowledge Foundation Japan

•使う

• LODチャレンジ

• ハッカソン・アイデアソン・街歩き

•支える

• 多様なステイクホルダーとの議論

• 意思決定者への働きかけ

• 「うちはまだオープンデータやらないんですか?」

Page 43: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

オープンデータ・アイデアソン

•11/9@グランフロント(受付終了)

•http://opendata-contest.jp

• 11/21@東京

• 11/26@松江

Page 44: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

LOD ハッカソン

•12/6 18:00〜 20:00@グランフロント

•12/7 10:00〜 18:00@大阪大学吹田キャンパス

•https://www.facebook.com/events/583277111709485

Page 45: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

AIツール入門セミナー

•12/16 10:00-17:00@大阪大学中之島センター

•http://www.ai-gakkai.or.jp/no05_jsai_tool_introductory_course/

•有料( 16000円)

Page 46: 地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)

まとめ

•政府レベルのオープンデータは着地点が見えてきた

•地域・都市レベルはこれから

• 多様性を生み出す土壌

• 開発者コミュニティのコミットメントが必要不可欠

• 地場産業へ!

•“Information wants to be free, and linked.”

大向 一輝(国立情報学研究所)http://researchmap.jp/[email protected] Twitter:@i2k