Upload
linked-open-data
View
5.789
Download
0
Embed Size (px)
Citation preview
Linked Open Dataとは
LODチャレンジ実行委員会
Linking Open Data運動
• 多くの人々がオープンにしたデータ(Open Data)を,皆でつなげて(Linkして),大きな価値を生み出していく
• Webを発明したTim Berners-Lee氏が提唱し,世界で広まっている
• データの「囲い込み」から「共有」へ
Linked Open Data(LOD)とは
• Web技術を利用して,オープンなデータ(Open Data)を公開し,つなげる(Linkする)仕組み
• Web空間を巨大なデータベースとして,問い合わせや利用が可能
データ
データ
データ 公開 問い合わせ
利用 Web空間
LODクラウド
2007/5/1 2007/11/7 2008/3/31
http://richard.cyganiak.de/2007/10/lod/
LODとして利用可能なデータセット間のリンク関係を図示
2009/3/27 2010/9/22
LODクラウド
政府・自治体
地理情報 ライフサイエンス
図書館・出版
ユーザ生成コンテンツ
メディア
http://richard.cyganiak.de/2007/10/lod/
クロスドメイン
2010/9/22
従来のWeb • 文書のWeb:文書ファイル(HTML)+リンク • 各文書の所在をURIで表す • 人間が読むことを想定 • 文書群に対してキーワード検索し,必要な情報を取得する
HTML HTML
HTML
HTML
リンク
リンク
データベース データベース データベース データベース
出版社 書店 図書館 クチコミ
・各Webサイトが持っている
データベースどうしはつながっていない ・同じ書籍に関するデータであるかどうかを計算機に判定させるには,ひと手間必要
HTML HTML HTML HTML
従来のWeb
LODによるデータのWeb • データのWeb:データ(RDF)+リンク • 各データの所在をURIで表す • 計算機が読むことを想定 • データ群に対してSQLライクな条件式で検索し,必要な情報を得る
RDFデータ
RDFデータ
RDFデータ
データベース データベース データベース データベース
出版社 書店 図書館 クチコミ
萩野達也 斎藤 信男
2,940円
オーム社 author author
publisher
price
セマンティックWeb入門
データ自体をWeb上に公開し,共有する.個々のデータがIDを持っていて一意に識別できる
RDF RDF RDF
RDF
Linked Open Data Web空間
LODの基本的な仕組み • モノにURIで名前を付ける
– URIはグローバル – 同じURIは同じモノを表現
• リンクもURI – 関係性を表す語彙をURIで区別
• 省略表記 – 名前空間の接頭辞を利用 – http://dbpedia.org/resource/Japan ⇒ depedia:Japan
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
LODの基本的な仕組み
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
dbpedia:Tokyo dbpedia:Shintarō_Ishihara
dbpedia-owl:leaderName
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
dbpedia:Shintarō_Ishihara
dbpedia-owl:leaderName
URIが同じノードで2つのグラフを結合
LODの基本的な仕組み • どのような語彙を選ぶかはデータ作成者の自由 • 共通で使用できる語彙の整備が進みつつある • 分野,ドメインを越えてノードどうしをリンクすることで, データがLODクラウドとつながっていく
dbpedia:Japan dbpedia:Tokyo
dbpedia-owl:capital
dbpedia-owl:leaderName
dbpedia:Shintarō_Ishihara owl:sameAs
http://data.nytimes.com/59436095099277148161
LODの利用と公開
RDFストア 既存データ (RDB,CSVなど)
LOD公開ツール
SPARQL エンドボイント RDFダンプ
LODクラウド (Web空間)
LOD公開 LOD利用 アプリケーション
検索エンジン
RDFストア
ユーザインタフェース などへの出力 RDF
ファイル
C. Bizer, et. al(著), 萩野(訳), Linked Dataの仕組み, 情報処理,vol.52,no.3, 2011
LODとしてのデータ公開 • LODをWeb上で公開する
– 既存データ・新規データをRDF形式で作成する – SPARQLエンドポイントまたはRDFダンプを公開する
• LODを閲覧・検索する – ノードのURIに関してHTTPで問い合わせする – SPARQLエンドポイントを利用してデータを検索する
• 他のLODへRDFでリンクする – LODクラウドとつながって,たどることが可能に – sameAsにより同一のモノを指すURIを結びつける
• 公開情報をリポジトリサイトに登録する – CKANに登録すると,LODクラウドにデータ公開者ノードが作成される
LODの到達度
★ 形式に関係なく,オープンライセンスで公開する 例:表データの画像
★★ コンピュータで処理可能な構造化データで公開する 例:Excelデータ
★★★ オープンなデータ形式で公開する 例:CSVデータ
★★★★ URIを利用してモノに名前を付ける 例:RDFデータ
★★★★★ 他のデータへリンクする
http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/
“Raw data now!” by Tim Berners-Lee
LODの特徴
• だれでもWeb上でデータを公開できる • 語彙を自由に選んでデータを表現できる • だれでもデータに情報を付加できる • データの選択や加工の自由度が高い • お互いにデータを公開し,共有することで,これらの利便性が高まる
参考文献
• TED2009 Tim Berners-Lee on the next Web http://www.ted.com/talks/lang/jpn/tim_berners_lee_on_the_next_web.html
• TED2010 Tim Berners-Lee:The year open data went worldwide http://www.ted.com/talks/lang/jpn/tim_berners_lee_the_year_open_data_went_worldwide.html
参考文献
• Linked Data: Evolving the Web into a Global Data Space, Chrisitian Bizer and Tom Heath, 2011 http://linkeddatabook.com/editions/1.0/
• リンクするデータ(Linked Data)~広がり始めたデータのクラウド~,情報処理学会誌,vol.52,no.3,2011年. http://www.bookpark.ne.jp/cm/ipsj/mokuji.asp?category1=Magazine&vol=52&no=3
• セマンティックHTML/XHTML,神崎正英,毎日コミュニケーションズ,2009年.