Upload
s3works
View
684
Download
5
Embed Size (px)
DESCRIPTION
第2回LODチャレンジデー オープンデータAPI活用アイデアソン(統計編) ~統計オープンデータをつないでどんなことができる?~ でのプレゼン資料です.
Citation preview
LODデータベースAPIの紹介
LODチャレンジ実行委員会
2013/08/10
第2回LODチャレンジデー @ 渋谷ミクシィ
LOD
Linked Webの仕組みで 相互にリンクされた Open (一定のルールのもとで)
二次利用可能な Data 計算機可読なデータ
ボルト?
CC-BY 2.0 http://en.wikipedia.org/wiki/File:Usain_Bolt_2012_Olympics_1.jpg CC-BY-SA 3.0 http://commons.wikimedia.org/wiki/File:P_Mickey.png CC-BY-SA 3.0 http://en.wikipedia.org/wiki/File:DCA_06_2012_Chevy_Volt_4035.JPG CC-BY-SA 2.5 http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Bolt-with-nut.jpg
ボルト
陸上選手 自動車
アニメ映画 部品
CC-BY-SA 3.0 http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Berlino_Leichtathletik-WM.jpg CC-By-SA 3.0 http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Olympicstadium2.jpg
100m 9秒58 (WR)
Web空間上でのデータ共有=LOD
100m 9秒58 (WR)
LODとは • Web技術を利用して,オープンなデータ(Open Data)を公開し,つなげる(Linkする)仕組み
• Web空間を巨大なデータベース化して,問い合わせや利用が可能
• オープンデータの主要なデータモデルの1つ
データ
データ
データ 公開 問い合わせ
利用 Web空間 (グラフデータベース)
文書のWeb • 文書ファイル(HTML)+リンク • 各文書の所在をURIで表す • 人間が読むことを想定 • 文書群に対してキーワード検索し,必要な情報を取得する
HTML HTML
HTML
HTML
リンク
リンク
LODによるデータのWeb • データ(RDF)+リンク • 各データの所在をURIで表す • 計算機が読むことを想定 • データ群に対してSQLライクな条件式で検索し,必要な情報を得る
RDFデータ
RDFデータ
RDFデータ
LODの基本的な仕組み 1. 情報とリンクに名前をつける
2. 情報の所在とリンクをURIで表現
– 同じURIは同じモノを表現
3. 名前空間の接頭辞を利用
Japan Tokyo Capital
http://dbpedia.org/resource/Japan
http://dbpedia.org/resource/Tokyo
http://dbpedia.org/ontology/capital
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
LODの基本的な仕組み
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
dbpedia:Tokyo dbpedia:Naoki_Inose
dbpedia-owl:leaderName
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
dbpedia:Naoki_Inose
dbpedia-owl:leaderName
URIが同じノードで2つのグラフを結合
LODの基本的な仕組み 分野,ドメインを越えてデータどうしをリンクすることで,つながりが広がっていく
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
dbpedia-owl:leaderName
dbpedia:Naoki_Inose owl:sameAs
http://data.nytimes.com/59436095099277148161
DBpedia
NYTimes
LODクラウド
分野,ドメインを越えてデータどうしをリンクすることで,データセットどうしがつながったLODクラウドが形成されている
RDFデータ
RDFデータ
RDFデータ
DBpedia NYTimes
BBC
DBpedia Japanese
Wikipedia日本語版 DBpedia Japanese
SPARQL • LODデータセットに対するクエリ言語
• W3C標準のAPI(エンドポイントと呼ぶ)
PREFIX dbpja: <http://ja.dbpedia.org/property/> PREFIX dcterms: <http://purl.org/dc/terms/> select distinct ?movie ?director ?actor // 映画名,監督名,出演者名を取得 where { ?m dcterms:subject <http://ja.dbpedia.org/resource/Category:日本の映画作品> . // 映画 ?m の主題は日本の映画作品である ?m dbpja:監督 ?d . // 映画 ?m の監督は ?d である ?m dbpja:出演者 ?a . // 映画 ?m の出演者は ?a である ?m rdfs:label ?movie . // 映画 ?m の名前は ?movie である ?d rdfs:label ?director . // 監督 ?d の名前は ?director である ?a rdfs:label ?actor . // 出演者 ?a の名前は ?actor である }
?m
?d
dbpja:監督
?a
?director
dbpja:出演者
?actor rdfs:label
rdfs:label
?movie rdfs:label
Category: 日本の映画作品
dcterms:subject
SPARQL package for R • RでSPARQLを利用するためのパッケージ
• コードは4行だけ! • URIに日本語を含むと,うまく動作しない場合がある
> library(SPARQL) > endpoint <- "http://ja.dbpedia.org/sparql" // エンドポイントのURI > query <-'select ...' // クエリ > res <- SPARQL(endpoint,query)$results movie director actor 1 パラサイト・イヴ 落合正幸 稲垣吾郎 2 パラサイト・イヴ 落合正幸 別所哲也 3 パラサイト・イヴ 落合正幸 三上博史 4 パラサイト・イヴ 落合正幸 中嶋朋子 5 パラサイト・イヴ 落合正幸 葉月里緒菜 ...
http://semanticweb.cs.vu.nl/R/ http://linkedscience.org/tools/sparql-package-for-r/ http://cran.r-project.org/web/packages/SPARQL/ http://www.slideshare.net/nezuQ/rsparql
Gephiで監督と出演者の関係を可視化
日本の主なSPARQLエンドポイント
http://lodcu.cs.chubu.ac.jp/SparqlEPCU/index.jsp http://lod.ac/ http://id.ndl.go.jp/auth/ndla http://fp.yafjp.org/yokohama_art_lod
SparqlEPCU RDFデータ格納,および登録したRDFデータのSPARQL検索
LODAC 博物館・美術館データ,生物種データなど
Web NDL Authorities 国立国会図書館典拠データ 検索・提供サービス
ヨコハマ・アート・LOD
LinkData.org App.LinkData.org
データを使ってアプリを作る
アプリで使えるデータを作る
データ公開とアプリ公開の 両方ができるプラットフォーム
テーブルデータの変換と公開をサポートする LinkData.org
テーブル形式の データをアップロード
• R • Simple Data Format • TSV • RDF/Turtle • RDF/JSON • RDF/XML • RSS • KML(緯度・経度情報が含ま
れる場合)
様々な形式のAPIに変換して公開
現在提供しているAPIは全8種
地域資源の情報をオープンデータとして 共有するためのデータベースサイト CityData.jp
データを使ったアプリの作成・公開をサポートする App.LinkData.org
LinkDataに公開されている全てのデータが、アプリの入力データとして利用可能
オンラインエディタでJavaScriptを 書いて即、アプリとして公開
公開アプリはフォーク可能
Fork