18
Linked Open Dataとは LODチャレンジ実行委員会

Linked Open Dataとは

Embed Size (px)

Citation preview

Page 1: Linked Open Dataとは

Linked Open Dataとは

LODチャレンジ実行委員会

Page 2: Linked Open Dataとは

Linking Open Data運動

• 多くの人々がオープンにしたデータ(Open Data)を,皆でつなげて(Linkして),大きな価値を生み出していく

• Webを発明したTim Berners-Lee氏が提唱し,世界で広まっている

• データの「囲い込み」から「共有」へ

Page 3: Linked Open Dataとは

Linked Open Data(LOD)とは

• Web技術を利用して,オープンなデータ(Open Data)を公開し,つなげる(Linkする)仕組み

• Web空間を巨大なデータベースとして,問い合わせや利用が可能

データ

データ

データ 公開 問い合わせ

利用 Web空間

Page 4: Linked Open Dataとは

LODクラウド

2007/5/1 2007/11/7 2008/3/31

http://richard.cyganiak.de/2007/10/lod/

LODとして利用可能なデータセット間のリンク関係を図示

2009/3/27 2010/9/22

Page 5: Linked Open Dataとは

LODクラウド

政府・自治体

地理情報 ライフサイエンス

図書館・出版

ユーザ生成コンテンツ

メディア

http://richard.cyganiak.de/2007/10/lod/

クロスドメイン

2010/9/22

Page 6: Linked Open Dataとは

従来のWeb • 文書のWeb:文書ファイル(HTML)+リンク • 各文書の所在をURIで表す • 人間が読むことを想定 • 文書群に対してキーワード検索し,必要な情報を取得する

HTML HTML

HTML

HTML

リンク

リンク

Page 7: Linked Open Dataとは

データベース データベース データベース データベース

出版社 書店 図書館 クチコミ

・各Webサイトが持っている

データベースどうしはつながっていない ・同じ書籍に関するデータであるかどうかを計算機に判定させるには,ひと手間必要

HTML HTML HTML HTML

従来のWeb

Page 8: Linked Open Dataとは

LODによるデータのWeb • データのWeb:データ(RDF)+リンク • 各データの所在をURIで表す • 計算機が読むことを想定 • データ群に対してSQLライクな条件式で検索し,必要な情報を得る

RDFデータ

RDFデータ

RDFデータ

Page 9: Linked Open Dataとは

データベース データベース データベース データベース

出版社 書店 図書館 クチコミ

萩野達也 斎藤 信男

2,940円

オーム社 author author

publisher

price

セマンティックWeb入門

データ自体をWeb上に公開し,共有する.個々のデータがIDを持っていて一意に識別できる

RDF RDF RDF

RDF

Linked Open Data Web空間

Page 10: Linked Open Dataとは

LODの基本的な仕組み • モノにURIで名前を付ける

– URIはグローバル – 同じURIは同じモノを表現

• リンクもURI – 関係性を表す語彙をURIで区別

• 省略表記 – 名前空間の接頭辞を利用 – http://dbpedia.org/resource/Japan ⇒ depedia:Japan

dbpedia:Japan dbpedia:Tokyo

dbpedia-owl:capital

Page 11: Linked Open Dataとは

LODの基本的な仕組み

dbpedia:Japan dbpedia:Tokyo

dbpedia-owl:capital

dbpedia:Tokyo dbpedia:Shintarō_Ishihara

dbpedia-owl:leaderName

dbpedia:Japan dbpedia:Tokyo

dbpedia-owl:capital

dbpedia:Shintarō_Ishihara

dbpedia-owl:leaderName

URIが同じノードで2つのグラフを結合

Page 12: Linked Open Dataとは

LODの基本的な仕組み • どのような語彙を選ぶかはデータ作成者の自由 • 共通で使用できる語彙の整備が進みつつある • 分野,ドメインを越えてノードどうしをリンクすることで, データがLODクラウドとつながっていく

dbpedia:Japan dbpedia:Tokyo

dbpedia-owl:capital

dbpedia-owl:leaderName

dbpedia:Shintarō_Ishihara owl:sameAs

http://data.nytimes.com/59436095099277148161

Page 13: Linked Open Dataとは

LODの利用と公開

RDFストア 既存データ (RDB,CSVなど)

LOD公開ツール

SPARQL エンドボイント RDFダンプ

LODクラウド (Web空間)

LOD公開 LOD利用 アプリケーション

検索エンジン

RDFストア

ユーザインタフェース などへの出力 RDF

ファイル

C. Bizer, et. al(著), 萩野(訳), Linked Dataの仕組み, 情報処理,vol.52,no.3, 2011

Page 14: Linked Open Dataとは

LODとしてのデータ公開 • LODをWeb上で公開する

– 既存データ・新規データをRDF形式で作成する – SPARQLエンドポイントまたはRDFダンプを公開する

• LODを閲覧・検索する – ノードのURIに関してHTTPで問い合わせする – SPARQLエンドポイントを利用してデータを検索する

• 他のLODへRDFでリンクする – LODクラウドとつながって,たどることが可能に – sameAsにより同一のモノを指すURIを結びつける

• 公開情報をリポジトリサイトに登録する – CKANに登録すると,LODクラウドにデータ公開者ノードが作成される

Page 15: Linked Open Dataとは

LODの到達度

★ 形式に関係なく,オープンライセンスで公開する 例:表データの画像

★★ コンピュータで処理可能な構造化データで公開する 例:Excelデータ

★★★ オープンなデータ形式で公開する 例:CSVデータ

★★★★ URIを利用してモノに名前を付ける 例:RDFデータ

★★★★★ 他のデータへリンクする

http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/

“Raw data now!” by Tim Berners-Lee

Page 16: Linked Open Dataとは

LODの特徴

• だれでもWeb上でデータを公開できる • 語彙を自由に選んでデータを表現できる • だれでもデータに情報を付加できる • データの選択や加工の自由度が高い • お互いにデータを公開し,共有することで,これらの利便性が高まる

Page 17: Linked Open Dataとは

参考文献

• TED2009 Tim Berners-Lee on the next Web http://www.ted.com/talks/lang/jpn/tim_berners_lee_on_the_next_web.html

• TED2010 Tim Berners-Lee:The year open data went worldwide http://www.ted.com/talks/lang/jpn/tim_berners_lee_the_year_open_data_went_worldwide.html

Page 18: Linked Open Dataとは

参考文献

• Linked Data: Evolving the Web into a Global Data Space, Chrisitian Bizer and Tom Heath, 2011 http://linkeddatabook.com/editions/1.0/

• リンクするデータ(Linked Data)~広がり始めたデータのクラウド~,情報処理学会誌,vol.52,no.3,2011年. http://www.bookpark.ne.jp/cm/ipsj/mokuji.asp?category1=Magazine&vol=52&no=3

• セマンティックHTML/XHTML,神崎正英,毎日コミュニケーションズ,2009年.