42
Linked Data & Semantic Web Technology http://theiff.org/current/wp-content/uploads/2013/01/Linked-Menger-Sponges1.jpg

Interlinking for Linked Data

Embed Size (px)

DESCRIPTION

LOD(Linked Open Data)에서의 인터링킹(interlinking)에 대해 소개합니다. 인터링킹의 개념 및 중요성, 그리고 다양한 방법의 인터링킹과 어떻게 활용할 것인지에 대해 담고 있습니다.

Citation preview

Page 1: Interlinking for Linked Data

Linked Data & Semantic Web Technology http://theiff.org/current/wp-content/uploads/2013/01/Linked-Menger-Sponges1.jpg

Page 2: Interlinking for Linked Data

Linked Data & Semantic Web Technology

월드 와이드 웹 (World Wide Web)

HTML의 목적은 사람이 읽고 해석할 수 있는 연

결된 문서를 만드는 것

웹의 창시자

http://blogs.ua.es/pi/files/2013/02/tim-berners-lee.png

Page 3: Interlinking for Linked Data

Linked Data & Semantic Web Technology

문서의 웹 (The Web of Documents)

HTML HTML HTML API/

XML

A B C D

untyped

links

untyped

links untyped

links

Christian Bizer, Tom Heath, and Tim Berners-Lee, Linked Data: Principles and State of the Art, 2008.

Page 4: Interlinking for Linked Data

Linked Data & Semantic Web Technology

Linked Open Data

웹을 통해 사람과 기계가

읽고 처리할 수 있는 형태로 데이터에 대한 정보를 기술(description)

Page 5: Interlinking for Linked Data

Linked Data & Semantic Web Technology

Linked Open Data

웹 페이지가 서로 연결된 것처럼 데이터들끼리 다양한 관계에 의해

연결되어 있는 형태

Page 6: Interlinking for Linked Data

Linked Data & Semantic Web Technology

Linked Open Data

URI를 이용해서 누구나 데이터에 접근할 수 있으며

데이터에 대한 정보를 제공

Page 7: Interlinking for Linked Data

Linked Data & Semantic Web Technology

The Web of Documents The Web of Data

Analogy a global filesystem a global database

Primary objects documents things (or descriptions of things)

Links between documents (or sub-parts of) things (including documents)

Degree of structure fairly low high

Semantics of content

and links implicit explicit

Designed for human consumption machines first, humans later

Christian Bizer, Tom Heath, and Tim Berners-Lee, Linked Data: Principles and State of the Art, 2008.

Page 8: Interlinking for Linked Data

Linked Data & Semantic Web Technology

링크드 오픈 데이터가 이런 모습?

A

Thing

Thing

C

Thing

Thing

D

Thing

Thing

E

Thing

Thing

B

Thing

Thing

Page 9: Interlinking for Linked Data

Linked Data & Semantic Web Technology

Linked Data의 네 가지 원칙

1. 웹 상의 자원을 식별하기 위해 URI를 사용하라.

2. 웹 상의 자원들이 사람과 사용자 에이전트에 의해 참조(refer)되고 탐색(look up)될 수 있는 HTTP URI를 사용하라.

3. 자원의 URI가 역참조(dereference)될 때 자원에 대한 유용한 정보를 RDF/XML과 같은 표준 형식을 사용하여 제공하라.

4. 웹에서 다른 연관된 정보의 탐색을 개선하기 위해 다른 데이터와의 URI 연결(link)를 포함하라.

Tim Berners-Lee, Linked Data - Design Issues, 2006.

Page 10: Interlinking for Linked Data

Linked Data & Semantic Web Technology

링크드 오픈 데이터의 진정한 모습

A

typed

links

Thing

Thing

C

Thing

Thing

D

Thing

Thing

E

Thing

Thing

B

Thing

Thing

typed

links

typed

links

typed

links

Page 11: Interlinking for Linked Data

Linked Data & Semantic Web Technology

인터링킹 (Interlinking)

• 서로 다른 데이터 정보원들 사이에 데이터를 연결하는 것

A

typed

links

Thing

Thing

C

Thing

Thing

D

Thing

Thing

E

Thing

Thing

B

Thing

Thing

typed

links

typed

links

typed

links

Page 12: Interlinking for Linked Data

Linked Data & Semantic Web Technology

링크드 오픈 데이터의 활용까지

Christian Bizer, Tom Heath, and Tim Berners-Lee, Linked Data: Principles and State of the Art, 2008.

A

typed

links

Thing

Thing

C

Thing

Thing

D

Thing

Thing

E

Thing

Thing

B

Thing

Thing

typed

links

typed

links

typed

links

Linked Data

Mashups

Search

Engines

Linked Data

Browsers

Page 13: Interlinking for Linked Data

Linked Data & Semantic Web Technology

DBpedia와 다른 데이터 셋과의 인터링킹

http://lod-cloud.net/versions/2011-09-19/lod-cloud_colored.png

Page 14: Interlinking for Linked Data

Linked Data & Semantic Web Technology

Page 15: Interlinking for Linked Data

Linked Data & Semantic Web Technology

링크드 데이터에 관련된 사람들의 역할

http://findicons.com/icon/24571/user_group

http://findicons.com/icon/102535/user

http://findicons.com/icon/102523/administrator

http://findicons.com/icon/102561/client_2

http://download.topquadrant.com/composer/images/blog/TopBraid-FOAF.png

http://db.cse.ohio-state.edu/images/db.png

http://lod.nl.go.kr/home/about/dataset.jsp

http://wifo5-03.informatik.uni-mannheim.de/pubby/images/pubby-architecture.png

서비스 개발

사용자 데이터 발행

데이터 구축

모델링

변환

저장

발행

데이터 접근 서비스 접근

데이터 조회

Page 16: Interlinking for Linked Data

Linked Data & Semantic Web Technology

인터링킹에 관련된 사람들의 역할

http://findicons.com/icon/24571/user_group

http://findicons.com/icon/102535/user

http://findicons.com/icon/102523/administrator

http://findicons.com/icon/102561/client_2

http://download.topquadrant.com/composer/images/blog/TopBraid-FOAF.png

http://db.cse.ohio-state.edu/images/db.png

http://lod.nl.go.kr/home/about/dataset.jsp

http://wifo5-03.informatik.uni-mannheim.de/pubby/images/pubby-architecture.png

서비스 개발

사용자 데이터 발행

데이터 구축

모델링

변환

저장

발행

데이터 접근 서비스 접근

데이터 조회

인터링킹 구축 인터링킹 활용

Page 17: Interlinking for Linked Data

Linked Data & Semantic Web Technology

RDF 링크의 세 가지 주요 유형

• 관련 링크 (Relationship Links) – 다른 데이터 셋으로 사람, 장소, 유전자 등과 같이 관련된 것들을 연결하는 것

• 동질 링크 (Identity Links) – 동일한 객체나 추상적인 개념들을 식별하기 위해 다른 데이터 정보원에 존재하는 URI 에일리어스(aliase)에 연결하는 것

• 어휘 링크 (Vocabulary Links) – 데이터를 표현하기 위해 사용되는 용어 정의에 연결하는 것

Tom Heath and Christian Bizer, Linked Data: Evolving the Web into a Global Data Space, 2011.

Page 18: Interlinking for Linked Data

Linked Data & Semantic Web Technology

관련 링크 (Relationship Links)

• 데이터 셋 내부에 존재하는 데이터를 다른 데이터 셋에 기술된 개체와 연결하는 것 – 사는 장소 혹은 서지 정보와 같이 참고 자료로 활용될 수 있는 것들에 대한 연결

– 인터링킹 된 데이터 셋에 존재하는 데이터에 대한 탐색으로 활용

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .

@prefix foaf: <http://xmlns.com/foaf/0.1/> .

<http://biglynx.co.uk/people/dave-smith>

rdf:type foaf:Person ;

foaf:name "Dave Smith" ;

foaf:based_near <http://sws.geonames.org/3333125/> ;

foaf:based_near <http://dbpedia.org/resource/Birmingham> ;

foaf:topic_interest <http://dbpedia.org/resource/Wildlife_photography> ;

foaf:knows <http://dbpedia.org/resource/David_Attenborough> .

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

Page 19: Interlinking for Linked Data

Linked Data & Semantic Web Technology

biglynx:dave-smith

dbpedia:Birmingham

Dave Smith

dbpedia:Wildlife_photography

dbpedia:David_Attenborough

4102

dbpedia:Duran_Duran

Birmingham

foaf:name foaf:based_near

foaf:topic_interest

foaf:knows

dbpedia-owl:populationDensity

dbpedia-owl:hometown

rdfs:label

DBpedia Dataset

My Dataset

Mashup

Service Agent

Page 20: Interlinking for Linked Data

Linked Data & Semantic Web Technology

동질 링크 (Identity Links)

• URI 에일리어스(aliases) – 동일한 개체를 나타내는 다양한 URI들을 의미

• URI 에일리어스들 사이의 RDF 링크를 설정하는 것

– 다른 데이터 정보원에 존재하는 개체에 대한 추가적인 정보를 활용

<http://www.dave-smith.eg.uk#me>

<http://www.w3.org/2002/07/owl#sameAs>

<http://biglynx.co.uk/people/dave-smith> .

1.

Page 21: Interlinking for Linked Data

Linked Data & Semantic Web Technology

동질 링크 (Identity Links)

• 동질 링크를 사용하여 URI를 연결하는 것이 소셜 시스템과 같은 데이터의 웹 환경에서 기본이 되는 이유

– 서로 다른 견해들 (Different opinions)

• 다른 데이터 제공자에 의해 제공되는 동일한 자원의 정보들이 역참조되어 활용될 수 있기 때문에, 이를 통해 비록 동일한 자원이지만 서로 다른 관점이나 견해들을 파악하는데 활용될 수 있음

– 추적성 (Traceability)

• 서로 다른 URI를 사용함으로써 링크드 데이터의 소비자는 개체를 식별하기 위해 주어진 역참조 가능한 URI를 통해 특정 데이터 제공자가 해당 개체에 대해 무엇을 말하고자 하는지를 알 수 있음

– 중심점의 부재 (No central points of failure)

• 만약 이 세상의 모든 것들이 하나만 존재하며 단지 하나의 URI를 가지고 있다면, 이는 URI 할당을 위해 중앙집중화 된 명명 체계의 생성 및 운용을 필요로 함

• 결국 데이터의 웹 환경의 성장에 큰 장벽을 만드는 결과를 초래함

Page 22: Interlinking for Linked Data

Linked Data & Semantic Web Technology

동질 링크의 생성

• owl:sameAs

– 두 개의 URI가 동일한 사물 혹은 개념일 경우를 지정하기 위한 속성

• rdfs:seeAlso

– 주어진 자원에 대해 추가적인 정보를 제공하고 있는 자원을 지정하기 위한 속성

Page 23: Interlinking for Linked Data

Linked Data & Semantic Web Technology

biglynx:TimBerners-Lee dbpedia:Tim_Berners-Lee

Tim Berners-Lee Timothy John Berners-Lee

dbpedia:Unitarian_Universalism

1955-06-08

foaf:name

owl:sameAs

dbpedia-owl:birthName

dbpedia-owl:religion

dbpedia-owl:birthDate

DBpedia Dataset

My Dataset

Mashup

Service Agent Wikipedia

http://en.wikipedia.org/wiki/Tim_Berners-Lee

rdfs:seeAlso

Page 24: Interlinking for Linked Data

Linked Data & Semantic Web Technology

어휘 링크 (Vocabulary Links)

• 다른 정보원으로부터의 데이터 통합 – 서로 다른 데이터 정보원에 의해 사용된 스키마 사이의 연계가 필요함

– 용어들 사이의 데이터 통합과 이해를 위해 활용

• 이질적인 데이터 표현을 처리하기 위한 두 가지 접근방법 – 폭넓게 활용되고 있는 용어집의 용어들을 재사용

– 가능한 한 자기 설명(self-descriptive)을 포함하고 있는 데이터 생성 1. 역참조가 가능한 형태로 용어들을 식별하기 위한 URI 생성

2. RDF 링크의 형태로 서로 다른 용어집의 용어들 사이에 매핑(mapping)

Page 25: Interlinking for Linked Data

Linked Data & Semantic Web Technology

어휘 링크 (Vocabulary Links)

• 동일한 개념(용어)을 참조하기 위해 URI 사이의 관계를 지정하는 방법

– 서로 다른 용어가 동일한 의미를 가질 경우 • owl:equivalentClass

• owl:equivalentProperty

– 서로 다른 용어 사이에 느슨한 형태의 매핑이 필요할 경우 • rdfs:subClassOf

• rdfs:subPropertyOf

• skos:broadMatch

• skos:narrowMatch

Page 26: Interlinking for Linked Data

Linked Data & Semantic Web Technology

어휘 링크 (Vocabulary Links)

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .

@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .

@prefix owl: <http://www.w3.org/2002/07/owl#> .

@prefix co: <http://biglynx.co.uk/vocab/sme#> .

<http://biglynx.co.uk/vocab/sme#SmallMediumEnterprise>

rdf:type rdfs:Class ;

rdfs:label "Small or Medium-sized Enterprise" ;

rdfs:subClassOf <http://dbpedia.org/ontology/Company> .

rdfs:subClassOf <http://umbel.org/umbel/sc/Business> ;

rdfs:subClassOf <http://sw.opencyc.org/concept/Mx4rvVjQNpwpEbGdrcN5Y29ycA> ;

rdfs:subClassOf <http://rdf.freebase.com/ns/m/0qb7t> .

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

Page 27: Interlinking for Linked Data

Linked Data & Semantic Web Technology

biglynx:Person

dbpedia:Person

dbpedia:MyungjinLee

owl:equivalentClass

rdf:type

DBpedia Dataset

My Dataset

Mashup

Service Agent

biglynx:TimBerners-Lee

biglynx:dave-smith

rdf:type

rdf:type

dbpedia:YunaKim

rdf:type

Page 28: Interlinking for Linked Data

Linked Data & Semantic Web Technology

관련 연구 (LOD2)

Page 29: Interlinking for Linked Data

Linked Data & Semantic Web Technology

SILK

• 데이터의 웹 환경에서 링크를 발견하기 위한 프레임워크 – http://wifo5-03.informatik.uni-mannheim.de/bizer/silk/

• 특징 및 기능 – owl:sameAs를 포함하여 다양한 형태의 RDF 링크를 지원

– 링크 연결을 위한 조건을 지정할 수 있는 언어를 활용

– 외부에 분산되어 저장된 데이터 셋을 활용 가능

– 성능 향상을 위해 캐쉬 및 인덱싱 기능 지원

Page 30: Interlinking for Linked Data

Linked Data & Semantic Web Technology

Page 31: Interlinking for Linked Data

Linked Data & Semantic Web Technology

Silk Workbench

Page 32: Interlinking for Linked Data

Linked Data & Semantic Web Technology

Silk Workbench

Page 33: Interlinking for Linked Data

Linked Data & Semantic Web Technology

Silk Workbench

Page 34: Interlinking for Linked Data

Linked Data & Semantic Web Technology

LIMES

• 데이터의 웹 환경에서 대규모의 링크 발견을 위한 방법론 – http://aksw.org/Projects/LIMES.html

• 문제점 – 데이터 셋 간의 링크 발견 시에 발생하는 연산의 복잡도

• A 데이터 셋의 인스턴스 수 * B 데이터 셋의 인스턴스 수

• 특징 및 기능 – 링크드 데이터 정보원 사이의 링크 발견을 위한 시간 효율적인 방법론

– 삼각부등식(triangle inequality) 방법론을 활용

Page 35: Interlinking for Linked Data

Linked Data & Semantic Web Technology

SAIM Instance Matching Application

Page 36: Interlinking for Linked Data

Linked Data & Semantic Web Technology

SAIM Instance Matching Application

Page 37: Interlinking for Linked Data

Linked Data & Semantic Web Technology

SAIM Instance Matching Application

Page 38: Interlinking for Linked Data

Linked Data & Semantic Web Technology

인터링킹의 활용

• 링크드 데이터는 데이터 사용자가 보다 쉽게 다양한 데이터 정보원으로부터 데이터를 통합하고 탐색하는데 유연한 패러다임을 제공

– 데이터 모델의 통합

– 표준화된 데이터 접근 메카니즘

– 하이퍼링크 기반의 데이터 발견

– 자기 기술 형태의 데이터

Page 39: Interlinking for Linked Data

Linked Data & Semantic Web Technology

링크드 데이터 융합(Fusion) 시 고려사항

• 단일 스키마로의 데이터 맵핑

• 다양한 정보원으로부터 단일 개체에 대한 정보 통합

• 데이터의 불일치성 전략 1. 불일치 된 데이터 무시

전략 2. 나에게 없는 값들은 선택

전략 3. 확신할 수 있는 정보원의 값을 활용

전략 4. 공통적인 값들을 선택

전략 5. 평균값을 선택

전략 6. 가장 최근의 값을 활용

Page 40: Interlinking for Linked Data

Linked Data & Semantic Web Technology

인터링킹은

좋은 링크드 오픈 데이터 구축을 위한

기본적이며 필수적인 요소

서비스 개발자는

인터링킹을 적극적으로 활용하여

보다 좋은 서비스 제공

Page 41: Interlinking for Linked Data

Linked Data & Semantic Web Technology

References

• Tom Heath and Christian Bizer, Linked Data: Evolving the Web into a Global Data Space, 2011.

http://linkeddatabook.com/editions/1.0/

• Christian Bizer, Tom Heath, and Tim Berners-Lee, Linked Data: Principles and State of the Art, 2008.

http://www.w3.org/2008/Talks/WWW2008-W3CTrack-LOD.pdf

• Tim Berners-Lee, Linked Data - Design Issues, 2006.

http://www.w3.org/DesignIssues/LinkedData.html

• Myungjin Lee, Linked Open Data Tutorial, 2014.

http://www.slideshare.net/onlyjiny/linked-open-data-tutorial

• Julius Volz, Christian Bizer, Martin Gaedke, and Georgi Kobilarov, Silk – A Link Discovery Framework for the

Web of Data, 2nd Workshop about Linked Data on the Web (LDOW2009), Madrid, Spain, April 2009.

http://events.linkeddata.org/ldow2009/papers/ldow2009_paper13.pdf

• Axel-Cyrille Ngonga Ngomo and Sören Auer, LIMES - A Time-Efficient Approach for Large-Scale Link Discovery

on the Web of Data, Proceedings of IJCAI, 2011.

http://svn.aksw.org/papers/2011/WWW_LIMES/public.pdf

• Chris Bizer, The Emerging Web of Linked Data, 2009

http://lpis.csd.auth.gr/mtpx/sw/material/IEEE-IS/IS-24-5.pdf

• Christian Bizer, Fusing the Web of Data, 2008

http://wifo5-03.informatik.uni-mannheim.de/bizer/pub/ASWC-DIST-Talk.pdf

Page 42: Interlinking for Linked Data

Linked Data & Semantic Web Technology

Dr. Myungjin Lee

e-Mail : [email protected]

Twitter : http://twitter.com/MyungjinLee

Facebook : http://www.facebook.com/mjinlee

SlideShare : http://www.slideshare.net/onlyjiny/

http://www.beauticians.nl/wp-content/uploads/2012/01/contact1.jpg