SPARQLとMashup環境 (年岡先生)

Preview:

DESCRIPTION

2014年9月13日「LODチャレンジデー2014 in 名古屋」での中部大学の年岡先生によるご講演内容です

Citation preview

SPARQLとMashup環境

年岡晃一 中部大学

LODチャレンジJapan実行委員 東海地区支部長 toshioka@cs.chubu.ac.jp

SparqlEPCU 2014/09/07 1

http://lodcu.cs.chubu.ac.jp/SparqlEPCU/ 2014/09/07

contents

I. LOD開発の現況 II. LODとは III. プログラミング無しで

1. データ登録と更新 2. 検索

IV. プログラミングして 1. Mashup 2. サンプルコード

V. SPARQLを学ぶ VI. さらに学ぶには(今回パス)

SparqlEPCU 2014/09/07 2

9/13 LODチャレンジデー2014 in 名古屋 でも話します

I.LOD開発の現況

SparqlEPCU 2014/09/07 3

LOD構築の実際

SparqlEPCU 2014/09/07 4

行政 学術機関

民間 民間・学術機関

データ作成者 RDFデータ公開者

アプリ開発者 SPARQL Endpoint提供者

SPARQL利用 RでもOK

データ提供

データ収集

LinkData

DBpedia DBpediaJapanese SparqlEPCU LODAC Museum ・・・

RDFstore

Sparql Timeliner LOD Browser ・・・

エンドユーザー

多くはSPARQLコマンド画面を用意している

LOD構築の実際

SparqlEPCU 2014/09/07 5

行政 学術機関

民間 民間・学術機関

データ作成者 RDFデータ公開者

アプリ開発者 SPARQL Endpoint提供者

SPARQL

csv,xls,xml

csv,ttl

LinkData

csv,ttl

DBpedia DBpediaJapanese SparqlEPCU LODAC Museum ・・・

RDFstore

Sparql Timeliner LOD Browser ・・・

エンドユーザー

GUI

LOD catalog

CKAN

Fuseki virtuoso

II.Linked Open Data(LOD)とは

SparqlEPCU 2014/09/07 6

RDFとは (Resource Description Framework ) SPARQLとは (SPARQL Protocol and RDF Query Language)

rel:participant

bibo:organizer

RDF(Resource Description Framework)

CodeForNagoya Meeting foaf:name

2014-09-27

http://codeForJapan.org/conf19

dc:date

http://www.facebook.com/kawaguchi

河口信夫

foaf:name http://codeForeJapan.org/

http://www.facebook.com/miyauchi 宮内元 foaf:name

CodeForNagoya

foaf:name nco:representative

foaf:knows

事物をURIで指定する 事物間の関係を意味的リンクで結ぶグラフでデータを表現する(モデル)

規則 ノードはURIで特定できる(世界で只1つ) プロパティもURIなので関係性の意味定義も唯一が保証される

WEB上の知識(リソース)を URIで特定し、「意味定義が唯一」が保証

された述語で表現していきましょうLOD

RDFとは

SparqlEPCU 2014/09/07 8

名古屋 愛知

河村

橋本

市長

友人

グラフ表現による知識ネットワーク

実世界

メタデータ

検索 SPARQL

select ?s, ?o where{ ?s 県 愛知 . ?s 市長 ?o . }

SparqlEPCU 2014/09/07 9

?s

愛知

?o

市長

検索はグラフ探索だが上記テーブルの自己結合で出来る

愛知県にある市の市長は誰? subject predicate object

名古屋 県 愛知

松阪 県 三重

千種 市 名古屋市

松本町 市 春日井市

担当教員 町 松本町

名古屋 市長 河村

松本町 町長 佐藤

このトリプルが知識の最少単位

LODデータ

Webアプリケーションサイト(LODアプリ)

エンドユーザ

CLOUD

SparqlEPCU 2014/09/07 10

LODアプリサイト

がマッシュアップで作れるわ♪

グーグルマップの環境と同じ

III.先ずはプログラミング無しで データ格納と データ検索

SparqlEPCU 2014/09/07 11

誰でも手軽にRDFをアップロードしてSPARQLでクエリかけられる

http://lodcu.cs.chubu.ac.jp/SparqlEPCU/

コース順

SparqlEPCU 2014/09/07 12

データの登録

データの検索

プログラミング無しで、RDFの登録・検索を体験

データの登録

データの検索

JavaScriptを書いて、

RDFの登録・検索を体験

csv形式 緯度・経度

csv形式 緯度・経度

CSV形式でRDF登録データを準備する

• addCSV.html

SparqlEPCU 2014/09/07 13

@学生, 学籍, 名前, mail ID09038, 藤木 晋太郎, fujiki_s@mail.com ID09000, 青山 哲也, aoyama_t@mail.com ID09001, 伊藤 信士, ito_s@mail.com ID09002, 遠藤 京子, endo_k@mail.com

クラス 属性

個々の データ

_id 学籍

名前

学生

ID09xx

藤木xx

fujiki@xx mail type

CSV形式でRDF登録 (subjectIDを付けて)

• addCSV2.html

SparqlEPCU 2014/09/07 14

@学生, SubjectID, 学籍, 名前, mail http://aaa/, ID09038, 藤木 晋太郎, fujiki_s@mail.com http://bbb/, ID09000, 青山 哲也, aoyama_t@mail.com http://ccc/, ID09001, 伊藤 信士, ito_s@mail.com http://ddd/, ID09002, 遠藤 京子, endo_k@mail.com

クラス 属性

個々の データ

http://aaa/ 学籍

名前

学生

ID09xx

藤木xx

fujiki@xx mail type

先頭属性がsubjectIDであれば、指定URLのRDF登録になります

データを登録する

SparqlEPCU 2014/09/07 15

登録したデータを検索してみる

SparqlEPCU 2014/09/07 16

IV.ここからはプログラミング

SparqlEPCU 2014/09/07 17

JavaScript jQuery LODを簡単に扱うためのJSライブラリ サンプルコードをダウンロード

マッシュアップ環境

SlideShare http://www.slideshare.net/KohichiToshioka/sparql-epculod-28065847

SparqlEPCU RDFstoreにアクセスするJavaScript APIを公開

SparqlEPCU 2014/09/07 18

LODデータ

Webアプリケーションサイト(LODアプリ)

エンドユーザ

認証システム OAuth

CLOUD

SparqlEPCU 2014/09/07 19

LODアプリサイト

がマッシュアップで作れるわ♪

SparqlEPCUでは、各LODデータ

セット毎にアクセス権設定を行えるようにしている

JavaScript APIをつかう RDFの登録 RDFの更新 RDFの削除

RDFの検索(SPARQL実行)

SparqlEPCU 2014/09/07 20

Zipを解凍してindex.htmlをダブルクリック

開発にあたっての前提知識

• RDFに関する知識 • JavaScript, jQuery, JSON • RDF登録の入力データ形式

– CSV – TURTLE – N3 – RDF/XML – N-TRIPLE

• RDFダウンロード – TURTLE – N3 – RDF/XML – N-TRIPLE

SparqlEPCU 2014/09/07 21

LOD登録script <script type="text/javascript"> //インスタンスの宣言 var rdfmgr = new RDFmgr( rdfserver_project ); function goData(){ rdfmgr.insertInstance({ // CSV形式のデータをSparqlEPCUに送信 rdfdata: $("#csvdata").val(), success: function(){ alert("成功しました。"); } , error: getErrorMsg, overwrite: false }); } //エラー表示用関数 function getErrorMsg ( eType,eMsg,eInfo ){ alert(eMsg+"¥n¥n"+eInfo); } </script>

SparqlEPCU 2014/09/07 22

LOD検索script function sparqlSend () { var stext = $(“#sparql”).val(); // 検索式を入力フィールドより持って来る rdfmgr.executeSparql ( { // SPARQL検索を行う sparql: stext, // 検索式 inference: false, // 推論を行うか行わないかを指定する success: maketable, // 処理が終わった時に表示関数を呼び出す指定 error: getErrorMsg // 例外が起きた時にエラー処理関数を呼び出す }); } function maketable(re) { // 検索結果のJSONデータを、イテレータを使用して取り出して表作成する $("#disp").empty(); var str = new String("<tr>"); for(var i=0; i<re.getKeyListLength();i++){ str += “<td>”+re.getKey(i)+“</td>”; } str += "</tr>"; while(re.next()) { for(var i=0; i < re.getLength();i++) { str += “<td><pre>”+re.getValue(i)+“</pre></td>”; } str += "</tr>"; } $("#disp").append(str); }

SparqlEPCU 2014/09/07 23

http://lodcu.cs.chubu.ac.jp/SparqlEPCU/RDFServer.jsp?reqtype=api&project=nagoyadata&query=select * where{?s ?p ?o}&output=JSON

DeleteInstance

GET http://lodcu.cs.chubu.ac.jp/SparqlEPCU/RDFServer.jsp? sparqlCallback=xxx& hostname=& reqtype=manage& type=removeInstance& graphID=null& project=test2& subject= http://lodcu.cs.chubu.ac.jp/SparqlEPCU/project/test2#id_2

SparqlEPCU 2014/09/07 24

APIs

• CSV形式で登録されたインスタンスの操作 – rdfmgr.insertInstance() – rdfmgr.updateInstance() – rdfmgr.deleteInstance()

• 検索 – rdfmgr.executeSparql ()

• 3つ組みとしての操作

– rdfmgr.insertStatement() – rdfmgr.updateStatement() – Rdfmgr.deleteStatement()

SparqlEPCU 2014/09/07 25

LOD Browserで検索してみる

SparqlEPCU 2014/09/07 26

緯度、経度情報があればgoogleマップ上に表示します。この画面で編集も出来ます。

SparqlEPCUの今後

• NamedGraphの利用 – 現バージョンでも使える

• FederatedSearchへの対応 • GoogleRefineや語彙のNegotiation • ScaleOut

SparqlEPCU 2014/09/07 27

V.SPARQLの機能いろいろ

SparqlEPCU 2014/09/07 28

SQLに似ている

SPARQLの諸機能

• DISTINCT • COUNT • LIMIT OFFSET • OPTIONAL • ORDER BY • GROUP BY • FILTER

SparqlEPCU 2014/09/07 29

SPARQL 1.1の追加機能 • CONSTRUCT • ASK • DESCRIBE • NAMED GRAPH

基本クエリ

SparqlEPCU 2014/09/07 30

SELECT * WHERE { ?s ?p ?o . }

?s

?p

?o

主語

述語

目的語

SELECT ?s ? p ?o WHERE { ?s ?p ?o . }

SELECT ? p ?o WHERE { ?s ?p ?o . }

左と同じ 主語は結果表示に含めない

DISTINCT 重複を取り除く

SparqlEPCU 2014/09/07 31

select DISTINCT ?o where { ?s lodcu:駅 ?o }

?s

?o

COUNT データ総数を返す

SparqlEPCU 2014/09/07 32

select (count(?o) as ?c) where { ?s lodcu:駅 ?o }

?s 駅

?o

select (count( distinct ?o) as ?c) where { ?s lodcu:駅 ?o }

上記では同じ駅が何回でも出て来るので

集約関数 他にSUM,AVG,MAX.MINなども

select (count(?s) as ?c) where { ?s ?p ?o }

すべてのトリプルを数える

LIMIT OFFSET

SparqlEPCU 2014/09/07 33

SELECT * WHERE { ?s ?p ?o . } LIMIT 5 offset 10

?s

?p

?o

ORDER BY

SparqlEPCU 2014/09/07 34

SELECT * WHERE {?s ?p ?o . } ORDER BY ?o

?s

?p

?o

降順なら ORDER BY DESC( ?o)

FILTER

SparqlEPCU 2014/09/07 35

SELECT * WHERE { ?s ?p ?o . FILTER (?o >2 && ?o <5) }

?s

?p

?o

条件で絞り込む

FILTER + regex

SparqlEPCU 2014/09/07 36

select * where { ?s ?p ?o. FILTER ( regex(?o,"名", "i")) }

?s

?p

?o

文字列検索

OPTIONAL

SparqlEPCU 2014/09/07 37

SELECT * WHERE { ?s rdfs:label ?o . OPTIONAL{ ?s lodcu:TEL ?o2 . } }

?s

?p

?o

在ればそれも出すという付帯的な条件

ラベル付きが必須だが、電話が無くてもリストには出る。 外部結合に相当する

GROUP BY+ count グループごとに集約関数

SparqlEPCU 2014/09/07 38

?s

?p

?o

SELECT ?o (count(?s) as ?cnt) WHERE {?s lodcu:駅 ?o . } GROUP BY ?o

BIND

SparqlEPCU 2014/09/07 39

select distinct ?o ?strlen where { ?s lodcu:駅 ?o . BIND (STRLEN(?o) as ?strlen) } order by desc(?strlen)

?s

?p

?o

他に

• 多言語用にラベルを用意 • 深いパスへの探索 • 複数LODサイトにSPARQLを実行してもらう

SparqlEPCU 2014/09/07 40

Thank you

SparqlEPCU 2014/09/07 41