Upload
hadang
View
215
Download
1
Embed Size (px)
Citation preview
Linked Data & Semantic Web Technology http://theiff.org/current/wp-content/uploads/2013/01/Linked-Menger-Sponges1.jpg
Linked Data & Semantic Web Technology
월드 와이드 웹 (World Wide Web)
HTML의 목적은 사람이 읽고 해석할 수 있는 연
결된 문서를 만드는 것
웹의 창시자
http://blogs.ua.es/pi/files/2013/02/tim-berners-lee.png
Linked Data & Semantic Web Technology
문서의 웹 (The Web of Documents)
HTML HTML HTML API/
XML
A B C D
untyped
links
untyped
links untyped
links
Christian Bizer, Tom Heath, and Tim Berners-Lee, Linked Data: Principles and State of the Art, 2008.
Linked Data & Semantic Web Technology
Linked Open Data
웹을 통해 사람과 기계가
읽고 처리할 수 있는 형태로 데이터에 대한 정보를 기술(description)
Linked Data & Semantic Web Technology
Linked Open Data
웹 페이지가 서로 연결된 것처럼 데이터들끼리 다양한 관계에 의해
연결되어 있는 형태
Linked Data & Semantic Web Technology
The Web of Documents The Web of Data
Analogy a global filesystem a global database
Primary objects documents things (or descriptions of things)
Links between documents (or sub-parts of) things (including documents)
Degree of structure fairly low high
Semantics of content
and links implicit explicit
Designed for human consumption machines first, humans later
Christian Bizer, Tom Heath, and Tim Berners-Lee, Linked Data: Principles and State of the Art, 2008.
Linked Data & Semantic Web Technology
링크드 오픈 데이터가 이런 모습?
A
Thing
Thing
C
Thing
Thing
D
Thing
Thing
E
Thing
Thing
B
Thing
Thing
Linked Data & Semantic Web Technology
Linked Data의 네 가지 원칙
1. 웹 상의 자원을 식별하기 위해 URI를 사용하라.
2. 웹 상의 자원들이 사람과 사용자 에이전트에 의해 참조(refer)되고 탐색(look up)될 수 있는 HTTP URI를 사용하라.
3. 자원의 URI가 역참조(dereference)될 때 자원에 대한 유용한 정보를 RDF/XML과 같은 표준 형식을 사용하여 제공하라.
4. 웹에서 다른 연관된 정보의 탐색을 개선하기 위해 다른 데이터와의 URI 연결(link)를 포함하라.
Tim Berners-Lee, Linked Data - Design Issues, 2006.
Linked Data & Semantic Web Technology
링크드 오픈 데이터의 진정한 모습
A
typed
links
Thing
Thing
C
Thing
Thing
D
Thing
Thing
E
Thing
Thing
B
Thing
Thing
typed
links
typed
links
typed
links
Linked Data & Semantic Web Technology
인터링킹 (Interlinking)
• 서로 다른 데이터 정보원들 사이에 데이터를 연결하는 것
A
typed
links
Thing
Thing
C
Thing
Thing
D
Thing
Thing
E
Thing
Thing
B
Thing
Thing
typed
links
typed
links
typed
links
Linked Data & Semantic Web Technology
링크드 오픈 데이터의 활용까지
Christian Bizer, Tom Heath, and Tim Berners-Lee, Linked Data: Principles and State of the Art, 2008.
A
typed
links
Thing
Thing
C
Thing
Thing
D
Thing
Thing
E
Thing
Thing
B
Thing
Thing
typed
links
typed
links
typed
links
Linked Data
Mashups
Search
Engines
Linked Data
Browsers
Linked Data & Semantic Web Technology
DBpedia와 다른 데이터 셋과의 인터링킹
http://lod-cloud.net/versions/2011-09-19/lod-cloud_colored.png
Linked Data & Semantic Web Technology
링크드 데이터에 관련된 사람들의 역할
http://findicons.com/icon/24571/user_group
http://findicons.com/icon/102535/user
http://findicons.com/icon/102523/administrator
http://findicons.com/icon/102561/client_2
http://download.topquadrant.com/composer/images/blog/TopBraid-FOAF.png
http://db.cse.ohio-state.edu/images/db.png
http://lod.nl.go.kr/home/about/dataset.jsp
http://wifo5-03.informatik.uni-mannheim.de/pubby/images/pubby-architecture.png
서비스 개발
사용자 데이터 발행
데이터 구축
모델링
변환
저장
발행
데이터 접근 서비스 접근
데이터 조회
Linked Data & Semantic Web Technology
인터링킹에 관련된 사람들의 역할
http://findicons.com/icon/24571/user_group
http://findicons.com/icon/102535/user
http://findicons.com/icon/102523/administrator
http://findicons.com/icon/102561/client_2
http://download.topquadrant.com/composer/images/blog/TopBraid-FOAF.png
http://db.cse.ohio-state.edu/images/db.png
http://lod.nl.go.kr/home/about/dataset.jsp
http://wifo5-03.informatik.uni-mannheim.de/pubby/images/pubby-architecture.png
서비스 개발
사용자 데이터 발행
데이터 구축
모델링
변환
저장
발행
데이터 접근 서비스 접근
데이터 조회
인터링킹 구축 인터링킹 활용
Linked Data & Semantic Web Technology
RDF 링크의 세 가지 주요 유형
• 관련 링크 (Relationship Links) – 다른 데이터 셋으로 사람, 장소, 유전자 등과 같이 관련된 것들을 연결하는 것
• 동질 링크 (Identity Links) – 동일한 객체나 추상적인 개념들을 식별하기 위해 다른 데이터 정보원에 존재하는 URI 에일리어스(aliase)에 연결하는 것
• 어휘 링크 (Vocabulary Links) – 데이터를 표현하기 위해 사용되는 용어 정의에 연결하는 것
Tom Heath and Christian Bizer, Linked Data: Evolving the Web into a Global Data Space, 2011.
Linked Data & Semantic Web Technology
관련 링크 (Relationship Links)
• 데이터 셋 내부에 존재하는 데이터를 다른 데이터 셋에 기술된 개체와 연결하는 것 – 사는 장소 혹은 서지 정보와 같이 참고 자료로 활용될 수 있는 것들에 대한 연결
– 인터링킹 된 데이터 셋에 존재하는 데이터에 대한 탐색으로 활용
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
<http://biglynx.co.uk/people/dave-smith>
rdf:type foaf:Person ;
foaf:name "Dave Smith" ;
foaf:based_near <http://sws.geonames.org/3333125/> ;
foaf:based_near <http://dbpedia.org/resource/Birmingham> ;
foaf:topic_interest <http://dbpedia.org/resource/Wildlife_photography> ;
foaf:knows <http://dbpedia.org/resource/David_Attenborough> .
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Linked Data & Semantic Web Technology
biglynx:dave-smith
dbpedia:Birmingham
Dave Smith
dbpedia:Wildlife_photography
dbpedia:David_Attenborough
4102
dbpedia:Duran_Duran
Birmingham
foaf:name foaf:based_near
foaf:topic_interest
foaf:knows
dbpedia-owl:populationDensity
dbpedia-owl:hometown
rdfs:label
DBpedia Dataset
My Dataset
Mashup
Service Agent
Linked Data & Semantic Web Technology
동질 링크 (Identity Links)
• URI 에일리어스(aliases) – 동일한 개체를 나타내는 다양한 URI들을 의미
• URI 에일리어스들 사이의 RDF 링크를 설정하는 것
– 다른 데이터 정보원에 존재하는 개체에 대한 추가적인 정보를 활용
<http://www.dave-smith.eg.uk#me>
<http://www.w3.org/2002/07/owl#sameAs>
<http://biglynx.co.uk/people/dave-smith> .
1.
Linked Data & Semantic Web Technology
동질 링크 (Identity Links)
• 동질 링크를 사용하여 URI를 연결하는 것이 소셜 시스템과 같은 데이터의 웹 환경에서 기본이 되는 이유
– 서로 다른 견해들 (Different opinions)
• 다른 데이터 제공자에 의해 제공되는 동일한 자원의 정보들이 역참조되어 활용될 수 있기 때문에, 이를 통해 비록 동일한 자원이지만 서로 다른 관점이나 견해들을 파악하는데 활용될 수 있음
– 추적성 (Traceability)
• 서로 다른 URI를 사용함으로써 링크드 데이터의 소비자는 개체를 식별하기 위해 주어진 역참조 가능한 URI를 통해 특정 데이터 제공자가 해당 개체에 대해 무엇을 말하고자 하는지를 알 수 있음
– 중심점의 부재 (No central points of failure)
• 만약 이 세상의 모든 것들이 하나만 존재하며 단지 하나의 URI를 가지고 있다면, 이는 URI 할당을 위해 중앙집중화 된 명명 체계의 생성 및 운용을 필요로 함
• 결국 데이터의 웹 환경의 성장에 큰 장벽을 만드는 결과를 초래함
Linked Data & Semantic Web Technology
동질 링크의 생성
• owl:sameAs
– 두 개의 URI가 동일한 사물 혹은 개념일 경우를 지정하기 위한 속성
• rdfs:seeAlso
– 주어진 자원에 대해 추가적인 정보를 제공하고 있는 자원을 지정하기 위한 속성
Linked Data & Semantic Web Technology
biglynx:TimBerners-Lee dbpedia:Tim_Berners-Lee
Tim Berners-Lee Timothy John Berners-Lee
dbpedia:Unitarian_Universalism
1955-06-08
foaf:name
owl:sameAs
dbpedia-owl:birthName
dbpedia-owl:religion
dbpedia-owl:birthDate
DBpedia Dataset
My Dataset
Mashup
Service Agent Wikipedia
http://en.wikipedia.org/wiki/Tim_Berners-Lee
rdfs:seeAlso
Linked Data & Semantic Web Technology
어휘 링크 (Vocabulary Links)
• 다른 정보원으로부터의 데이터 통합 – 서로 다른 데이터 정보원에 의해 사용된 스키마 사이의 연계가 필요함
– 용어들 사이의 데이터 통합과 이해를 위해 활용
• 이질적인 데이터 표현을 처리하기 위한 두 가지 접근방법 – 폭넓게 활용되고 있는 용어집의 용어들을 재사용
– 가능한 한 자기 설명(self-descriptive)을 포함하고 있는 데이터 생성 1. 역참조가 가능한 형태로 용어들을 식별하기 위한 URI 생성
2. RDF 링크의 형태로 서로 다른 용어집의 용어들 사이에 매핑(mapping)
Linked Data & Semantic Web Technology
어휘 링크 (Vocabulary Links)
• 동일한 개념(용어)을 참조하기 위해 URI 사이의 관계를 지정하는 방법
– 서로 다른 용어가 동일한 의미를 가질 경우 • owl:equivalentClass
• owl:equivalentProperty
– 서로 다른 용어 사이에 느슨한 형태의 매핑이 필요할 경우 • rdfs:subClassOf
• rdfs:subPropertyOf
• skos:broadMatch
• skos:narrowMatch
Linked Data & Semantic Web Technology
어휘 링크 (Vocabulary Links)
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix owl: <http://www.w3.org/2002/07/owl#> .
@prefix co: <http://biglynx.co.uk/vocab/sme#> .
<http://biglynx.co.uk/vocab/sme#SmallMediumEnterprise>
rdf:type rdfs:Class ;
rdfs:label "Small or Medium-sized Enterprise" ;
rdfs:subClassOf <http://dbpedia.org/ontology/Company> .
rdfs:subClassOf <http://umbel.org/umbel/sc/Business> ;
rdfs:subClassOf <http://sw.opencyc.org/concept/Mx4rvVjQNpwpEbGdrcN5Y29ycA> ;
rdfs:subClassOf <http://rdf.freebase.com/ns/m/0qb7t> .
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
Linked Data & Semantic Web Technology
biglynx:Person
dbpedia:Person
dbpedia:MyungjinLee
owl:equivalentClass
rdf:type
DBpedia Dataset
My Dataset
Mashup
Service Agent
biglynx:TimBerners-Lee
biglynx:dave-smith
rdf:type
rdf:type
dbpedia:YunaKim
rdf:type
Linked Data & Semantic Web Technology
SILK
• 데이터의 웹 환경에서 링크를 발견하기 위한 프레임워크 – http://wifo5-03.informatik.uni-mannheim.de/bizer/silk/
• 특징 및 기능 – owl:sameAs를 포함하여 다양한 형태의 RDF 링크를 지원
– 링크 연결을 위한 조건을 지정할 수 있는 언어를 활용
– 외부에 분산되어 저장된 데이터 셋을 활용 가능
– 성능 향상을 위해 캐쉬 및 인덱싱 기능 지원
Linked Data & Semantic Web Technology
LIMES
• 데이터의 웹 환경에서 대규모의 링크 발견을 위한 방법론 – http://aksw.org/Projects/LIMES.html
• 문제점 – 데이터 셋 간의 링크 발견 시에 발생하는 연산의 복잡도
• A 데이터 셋의 인스턴스 수 * B 데이터 셋의 인스턴스 수
• 특징 및 기능 – 링크드 데이터 정보원 사이의 링크 발견을 위한 시간 효율적인 방법론
– 삼각부등식(triangle inequality) 방법론을 활용
Linked Data & Semantic Web Technology
인터링킹의 활용
• 링크드 데이터는 데이터 사용자가 보다 쉽게 다양한 데이터 정보원으로부터 데이터를 통합하고 탐색하는데 유연한 패러다임을 제공
– 데이터 모델의 통합
– 표준화된 데이터 접근 메카니즘
– 하이퍼링크 기반의 데이터 발견
– 자기 기술 형태의 데이터
Linked Data & Semantic Web Technology
링크드 데이터 융합(Fusion) 시 고려사항
• 단일 스키마로의 데이터 맵핑
• 다양한 정보원으로부터 단일 개체에 대한 정보 통합
• 데이터의 불일치성 전략 1. 불일치 된 데이터 무시
전략 2. 나에게 없는 값들은 선택
전략 3. 확신할 수 있는 정보원의 값을 활용
전략 4. 공통적인 값들을 선택
전략 5. 평균값을 선택
전략 6. 가장 최근의 값을 활용
Linked Data & Semantic Web Technology
인터링킹은
좋은 링크드 오픈 데이터 구축을 위한
기본적이며 필수적인 요소
서비스 개발자는
인터링킹을 적극적으로 활용하여
보다 좋은 서비스 제공
Linked Data & Semantic Web Technology
References
• Tom Heath and Christian Bizer, Linked Data: Evolving the Web into a Global Data Space, 2011.
http://linkeddatabook.com/editions/1.0/
• Christian Bizer, Tom Heath, and Tim Berners-Lee, Linked Data: Principles and State of the Art, 2008.
http://www.w3.org/2008/Talks/WWW2008-W3CTrack-LOD.pdf
• Tim Berners-Lee, Linked Data - Design Issues, 2006.
http://www.w3.org/DesignIssues/LinkedData.html
• Myungjin Lee, Linked Open Data Tutorial, 2014.
http://www.slideshare.net/onlyjiny/linked-open-data-tutorial
• Julius Volz, Christian Bizer, Martin Gaedke, and Georgi Kobilarov, Silk – A Link Discovery Framework for the
Web of Data, 2nd Workshop about Linked Data on the Web (LDOW2009), Madrid, Spain, April 2009.
http://events.linkeddata.org/ldow2009/papers/ldow2009_paper13.pdf
• Axel-Cyrille Ngonga Ngomo and Sören Auer, LIMES - A Time-Efficient Approach for Large-Scale Link Discovery
on the Web of Data, Proceedings of IJCAI, 2011.
http://svn.aksw.org/papers/2011/WWW_LIMES/public.pdf
• Chris Bizer, The Emerging Web of Linked Data, 2009
http://lpis.csd.auth.gr/mtpx/sw/material/IEEE-IS/IS-24-5.pdf
• Christian Bizer, Fusing the Web of Data, 2008
http://wifo5-03.informatik.uni-mannheim.de/bizer/pub/ASWC-DIST-Talk.pdf
Linked Data & Semantic Web Technology
Dr. Myungjin Lee
e-Mail : [email protected]
Twitter : http://twitter.com/MyungjinLee
Facebook : http://www.facebook.com/mjinlee
SlideShare : http://www.slideshare.net/onlyjiny/
http://www.beauticians.nl/wp-content/uploads/2012/01/contact1.jpg