地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)...

Preview:

Citation preview

地場産業としてのオープンデータの可能性

国立情報学研究所大向 一輝

@i2k

自己紹介

オープンデータの例

http://www.tepco.co.jp/forecast/index-j.htmlhttp://www.kepco.co.jp/setsuden/graph/index.html

オープンデータとは

•データを誰でも使えるように

• ウェブ上で公開

• 再利用しやすい形で

•本当に盛り上がっているのか?

•何が難しいのか?

オープンデータの潮流

•世界のデータ公開

• アメリカ:政府情報のオープンデータ化に関する大統領令

• EU :公共セクター情報の再利用指令

• G8 :オープンデータ憲章

• 日本:電子行政オープンデータ戦略

•進捗の確認・ランキングOpen Data Index (WWWF)

Open Data Census (OKFN)

日本のオープンデータ

•政府レベル

• Open DATA METI (経済産業省)

• 次世代統計利用システム(総務省・統計センター)

• 内閣官房データカタログ

• 重点 5 分野

• 白書、防災・減災、 地理空間情報、人の移動、予算・調達

• 制限

• 個人情報、安全保障に関わる情報、法令で取り扱いが定められた情報

Open DATA METI

http://datameti.go.jp

次世代統計利用システム

http://statdb.nstac.go.jp

日本のオープンデータ

•地方自治体レベル

• データシティさばえ(福井県鯖江市)

• 千葉県流山市役所・市議会

• ビッグデータ・オープンデータ活用推進協議会(千葉市・奈良市・福岡市・武雄市)

• ・・・

• 主な公開データ

• 統計・地域情報・ GIS ・予算…

データシティさばえ

http://www.city.sabae.fukui.jp/pageview.html?id=11552

日本のオープンデータ

•草の根レベル

• 税金はどこへ行った?( 52 都市)

• Wikipedia タウン(横浜・二子玉川)

http://spending.jphttp://www.solabo.net/wiki0525/

International Open Data Day

青森・会津若松・千葉・東京・横浜名古屋・東海・鯖江・福岡

オープンデータとコミュニティ

•2 つのコミュニティ

• ハッカーと市民

•2 つのアクティビティ

• ハッカソンとアイデアソン

• オープンデータ・カレンダー

•CODE for AMERICA

• Civic tech/hack のコミュニティ

• 公共セクターへの技術者派遣

• 日本版 CODE for ***

ライセンス

再利用可

非独占的

識別子

LOD

ライセンス

•オープンライセンス

• 「 Open Definition 」に基づくライセンス

• 商用・非商用を問わない 2 次利用

• 出典の表示を求めてもよい

• Creative Commons または互換ライセンスがデファクトスタンダード

• CC-BY

• CC0

• ODC-by : Open Data Commons

構造化

•中身の構造化

• 「ネ申 Excel 」問題

• コード・項目名の共通化

•データ群の構造化

• カタログサイト

• メタデータ・管理体制

•課題• ファイルか API か

• Data.gov の例

作品

作品

図書

Linked Open Data

友人

在住

人物

作品

作品

Linked Open Data

舞台

観光地

観光地

観光

友人

在住作品

作品

Linked Open Data

現実のデータ

同じ?

関係ある?

同じ?

Linked Open Data の技術

•異なるデータベース上のデータ同士をつなぐ

• 識別する

• 同じものに同じアドレスをつける

• 関係づける

• リンクし、その意味(理由)を記述する

•ウェブの仕組みそのもの

• ウェブページとハイパーリンク

• 「文書のウェブ」から「データのウェブへ」

同じ!

Linked Open Data (詳細)

著者

春陽堂 1907

出版者 出版年

テーマ

作家 N 作品 B

地域 M

dc:creator

dc:publisher dc:date

foaf:topic

  主語       述語      目的語http://library.jp/B dc:creator http://library.jp/Nhttp://library.jp/B dc:publisher 春陽堂http://library.jp/B foaf:topic http://visitor.jp/M

坊っちゃん

タイトルdc:title

夏目漱石名前

foaf:name

図書館サービスhttp://library.jp

観光サイトhttp://visitor.jp

つながるデータ

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jenvtzsch. http://lod-cloud.net/ CC-BY-SA

LOD の利点

•標準化による分業体制の確立

• データの書き方: RDF

• 分野のスペシャリストはデータの記述に集中

• データの取り出し方: SPARQL

• RDF ストアのクエリ言語

• データの抽出に独自プログラムを必要としない

• TXT ・ CSV ・ XLS ・ XML との相違点

• 開発者はアプリケーションに集中

• アプリに合わせてデータを作る

• 「逆マッシュアップ」

DBpedia Japanese

http://ja.dbpedia.org

DBpedia Japanese

<prop-ja:選手名 xml:lang="ja">藤浪 晋太郎</prop-ja:選手名 ><prop-ja: 出身地 xml:lang="ja"> 大阪府堺市南区</prop-ja: 出身地 ><prop-ja:打席 xml:lang="ja">右</prop-ja:打席><prop-ja:wikiPageUsesTemplate rdf:resource="http://ja.dbpedia.org/resource/Template:阪神タイガース " /><prop-ja: 所属球団 xml:lang="ja">阪神タイガース </prop-ja: 所属球団><prop-ja:背番号>19</prop-ja:背番号><prop-ja:身長>197</prop-ja:身長><prop-ja:生年月日 >1994-04-12</prop-ja:生年月日 ><prop-ja: 利き腕 xml:lang="ja">右</prop-ja: 利き腕><prop-ja:ドラフト順位 xml:lang="ja">ドラフト 1位</prop-ja:ドラフト順位><prop-ja:守備位置 rdf:resource="http://ja.dbpedia.org/resource/投手 " /><prop-ja: 経歴 xml:lang=“ja”>* 大阪桐蔭高等学校 * 阪神タイガース </prop-ja: 経歴><prop-ja: 体重 >86</prop-ja: 体重 ><prop-ja:年俸>1500</prop-ja:年俸>

SPARQLエンドポイント

SELECT DISTINCT ?label ?birthYearWHERE { ?s <http://ja.dbpedia.org/property/生日> 1 ; <http://ja.dbpedia.org/property/生月> 1 ; <http://ja.dbpedia.org/property/生年> ?birthYear ; rdfs:label ?label .}ORDER BY ?birthYear

プロ野球因縁サーチ

http://innen-search.com

SPARQL Timeliner

http://uedayou.net/SPARQLTimeliner/

地場産業としてのオープンデータ

•いますぐオープンデータだけで儲かるか?→ たぶん No

• 他のデータとの組み合わせ

•データのあるところに人は集まる

• ウェブ API ・ソーシャルメディア

• 人を呼び込むこと・注目を集めること

•「鯖江モデル」人口 5万人

• 行政と開発者の直接的な信頼関係

•「横浜モデル」人口 370万人

• 市民団体・ NPO との連携

•規模と状況はそれぞれ、それぞれの方法で

地場産業としてのオープンデータ

•使う側から作る側へ

• 「情報の構造化」の専門家として

•データ提供側の「痛み」を知る

• 出したけど使われない

• 他の部署から反対される

• 具体的な「できない理由」と抽象的な「する理由」

•オープンデータならではの分業

• アプリ構築

• データ変換

• プラットフォーム提供

データを公開しない理由( 1/5 )

•無関心

• 誰も気にしていない

• コミュニティからの支援が得られない(市民ハッカーがいない)

•混乱• 明確な事例がない

• データを何のために使うのかわからない

• どんなデータが必要とされるのかがわからない

• データを公開する前に、どんな便益があるか明確にしてほしい

• 今のシステムで十分だ

• 人々を混乱させるだけだ

データを公開しない理由( 2/5 )

•困難

• とにかく複雑で難しい

• 大量のバックログを抱えている

• ついていけない、時間がない、変化が早すぎる

• データの量が膨大である

• 自分の時間の大部分が取られてしまう

•費用

• 予算がない

•スタッフ問題

• それは私の仕事ではない

• 私の上司や政治家はデータ公開を望んでいない

• やり方を知っている人がいない

データを公開しない理由( 3/5 )

•合法性• データや記録を公開する法的な権限を持っていない

• このデータを公開すれば、市民は私たちを訴える

• 私たちはデータに対する権利を持っていない

• 私たちがデータの所有者なのかどうなのかわからない

• データは販売するべきである。もし売りたくなったらどうすればよいのか?すでに売っている

• 機密データではないが、公開することでよい PR になるとは思えない

• 私たちの弁護士は特別なライセンスを付与するべきだと言っている

• このデータを集めるのに、膨大な時間・人・資源を投入した

• なぜデータを必要としているのかを知りたいので、直接窓口に来てほしい

• 誰かがパッケージングし直して売り払ってしまうのではないか

• データをだれが利用して、何を行ったのかをコントロールしたい

• 連邦政府や他の政府機関がすでにデータをもっているので、そちらから入手して欲しい

データを公開しない理由( 4/5 )

•正確さ

• データを一括して公開すると、だれかがそれを変更してしまう

• データを公開したりすると、私たちがハックされる

• データを公開すると、やり方によっては人々が誤解する危険がある

• 市民が混乱する、データの品質がそもそも高くない

•プライバシー

• プライバシー保護の懸念があり、データを公開できない

• もう既に公開している

• 窓口やプロバイダーを通じてすでに公開している

• 情報公開制度があるではないか

• すでに十分にデータは公開している

• API を提供しているではないか

• データポータルが必要なら、同じようなものはすでにある

データを公開しない理由( 5/5 )

•その他

• データが優秀な技術者集団や高等教育を受けたコミュニティに利用されると、デジタルデバイド問題がさらに深刻化する

• 今、それは優先事項ではない

• それについてはペンディング状態だ、似たようなプロジェクトもすでに始まっている

出典 : Reasons to Not Release Data, Part 1-Part 10, Sunlight Foundation

(日本語訳 : 「公的機関がデータを公開しない理由」 Open Knowledge Foundation Japan )

データの地産地消

•LODチャレンジ

•オープンデータのコンテスト

•アプリ部門・可視化部門・アイデア部門

•データ部門:データそのものを評価

•プラットフォーム部門:データを作る仕組みを評価

•MA9 シビックハック賞

LODチャレンジ

http://lod.sfc.keio.ac.jp/

受賞作品 – アプリケーション部門

•LinkData (http://linkdata.org/)

• テーブルデータを RDF 形式に変換・公開

• LOD 公開のインフラ

• CityData ・ LinkData App などの派生プロジェクト

受賞作品 – データセット部門

•saveMLAK (http://savemlak.jp/)

• ボランティアによる社会教育施設(図書館・博物館・文書館・公民館)の被災情報共有

• 実質的に入手可能な唯一の施設リスト

残念な日本地図

http://cheese-factory.info

オープンデータを広げるために

•知る

• 日経オープンデータ情報ポータル

• NHK NEWS WEB

• Open Knowledge Foundation Japan

•使う

• LODチャレンジ

• ハッカソン・アイデアソン・街歩き

•支える

• 多様なステイクホルダーとの議論

• 意思決定者への働きかけ

• 「うちはまだオープンデータやらないんですか?」

オープンデータ・アイデアソン

•11/9@グランフロント(受付終了)

•http://opendata-contest.jp

• 11/21@東京

• 11/26@松江

LOD ハッカソン

•12/6 18:00〜 20:00@グランフロント

•12/7 10:00〜 18:00@大阪大学吹田キャンパス

•https://www.facebook.com/events/583277111709485

AIツール入門セミナー

•12/16 10:00-17:00@大阪大学中之島センター

•http://www.ai-gakkai.or.jp/no05_jsai_tool_introductory_course/

•有料( 16000円)

まとめ

•政府レベルのオープンデータは着地点が見えてきた

•地域・都市レベルはこれから

• 多様性を生み出す土壌

• 開発者コミュニティのコミットメントが必要不可欠

• 地場産業へ!

•“Information wants to be free, and linked.”

大向 一輝(国立情報学研究所)http://researchmap.jp/i2ki2k@nii.ac.jp Twitter:@i2k

Recommended