Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
3 KISTI 지식리포트 제40호
❚ 목 차 ❚
1. 서론 ········································································································1
1) 시맨틱 웹과 링크드 데이터 ···························································1
2) 링크드 데이터의 원칙 ····································································2
2. 도서 링크드 데이터 ···········································································3
1) 도서 링크드 데이터의 특징 ·························································3
2) 도서 링크드 데이터 활동 ·····························································4
3. 도서 링크드 데이터 사례 ··································································8
1) 국 국립도서 ··············································································8
2) 독일 국립도서 ·············································································10
3) 랑스 국립도서 ·········································································11
4) OCLC(Online Computer Library Center) ····································13
5) LC Bibliographic Framework ·······················································17
4. 도서 링크드 데이터 구축의 필요성 ················································20
1) 데이터 심의 웹 생태계 ······························································20
2) 링크드 데이터의 실용성 ································································22
3) 링크드 데이터를 통한 근성 향상 ··············································26
5. 결론 제언 ·······················································································29
참고문헌 ···································································································31
KISTI 지식리포트 제40호
❚ 표 목 차 ❚
<표 1> 링크드 데이터의 혜택 ································································6
<표 2> 통 도서 데이터의 문제 ·····················································7
<표 3> LLD 실 을 한 권고사항 ·························································7
<표 4> OCLC 링크드 데이터 자원 ························································14
<표 5> 도메인별 링크드 데이터 황 ····················································21
도서관 분야의 링크드 데이터 구축 동향
❚ 그 림 목 차 ❚
<그림 1> 국 국립도서 단행본 링크드 데이터 모델 ·························9
<그림 2> 국 국립도서 연속간행물 링크드 데이터 모델 ·················9
<그림 3> 랑스 국립도서 RDF 데이터 모델 ···································13
<그림 4> WorldCat과 Schema.org를 활용한 WorldCat.org 서비스 효과 ·····15
<그림 5> WorldCat.org 서지정보 검색결과 ··········································15
<그림 6> OCLC 데이터셋 스키마 ··························································16
<그림 7> BIBFRAME Work-Instance 심 링크드 데이터 모델 ··········18
<그림 8> BIBFRAME Work-Instance-Annotation 링크드 데이터 모델 ··· 19
<그림 9> BIBFRAME의 텍스트, 비텍스트형 자원에 한 개념 모형 ····· 19
<그림 10> 링크드 데이터 황(2011년 9월 19일 재) ························20
<그림 11> LOV Aggregator 화면 ··························································23
<그림 12> LOV Suggest 화면 ································································24
<그림 13> LOV Search 화면 ··································································24
<그림 14> Clean Energy Linked Open Data Cloud ····························25
<그림 15> OECD Odata API 제 - 메타데이터 조회 ························27
<그림 16> 링크드 데이터 기반 BBC Music The Beatles 서비스 ·········28
<그림 17> BBC News Juicer 서비스 ·····················································28
KISTI 지식리포트 제40호
1 KISTI 지식리포트 제40호
1. 서론
1) 시맨틱 웹과 링크드 데이터
□ Web 2.0 이 후로 웹을 랫폼으로 거의 모든 정보활동이 일어남.
- 정보는 웹에서 탄생하고, 풍부해지고, 재창조되고, 공유되고, 확산되고,
소멸됨(박진호, 2013a).
- 사람들은 매일 웹에서 수많은 데이터를 활용하지만 이 데이터를 웹의
일부분으로 보기는 힘듦. 재의 데이터들은 애 리 이션에 의해서 통
제되는 것으로 각각의 애 리 이션이 이 데이터를 스스로 유지하고 있
음(W3Ca, n.d.).
□ 본래 웹은 사람뿐만 아니라 기계간에도 소통이 가능한 정보공간으로 설계
되었으나 재 웹은 잘 정의된 데이터베이스로부터 정보를 추출함에도 불
구하고 웹 로 등 기계 보다는 사람에게만 유용한 구조를 갖고 있음.
- 시맨틱 웹(Semantic Web)은 기계 처리가 가능한 형태로 정보를 표 하
기 한 언어를 개발하는 근법임(Tim Berners-Lee, 1998).
- 시맨틱 웹은 웹문서의 교환에 집 되어 다양한 출처(source)에서 가져온
데이터를 통합, 조합할 수 있는 공통의 형식을 만드는 것에 한 것이며,
한 데이터가 실세계의 개체를 어떻게 표 할 것인지에 한 것을 기
록하기 한 언어임(W3Ca, n.d.).
☐ 시맨틱 웹은 재의 문서 심의 웹(Web of Document)에 데이터가 심
이 되는 새로운 계층(Web of Data)을 만드는 것이고, 링크드 데이터
(Linked Data)는 시맨틱 웹을 구 하기 한 방법으로 역참조할 수 있는
(deRefernceable) URI(Uniform Resource Identifier)를 활용해서 웹상에 데
이터를 공개, 공유 연결하는 방법임.
- Berners-Lee(2007)는 재 웹의 단계는 연결의 웹(Web of Links)으로
일반 으로 네트워크라는 말 신 “웹”이라는 용어를 표 으로 사용하
고 있으며, 이를 문서의 웹(Web of Documents)으로 칭함.
- 궁극 으로 우리가 원하는 것은 모든 것(All Things)들이 웹에서 공유되
는 것으로 보다 직 으로 데이터( 통 인 데이터베이스 콘텐츠와 같은)
2도서관 분야의 링크드 데이터 구축 동향
를 웹에 확장해야 하고, 사람 혹은 분명한 실체를 갖고 있는 것과 추상
인 것, 장소 등과 연결 계를 만들어야 함.
- 거시 인 에서 이러한 연결을 데이터 웹(Web of data)라고 부를 수
있으며 이것이 링크드 데이터의 기 를 형성할 수 있음.
2) 링크드 데이터의 원칙
☐ Berners-Lee(2011)는 시맨틱 웹은 웹에 데이터를 올리는 것만을 의미하지
는 않으며, 링크를 만듦으로써 사람과 기계가 데이터 웹을 탐색할 수 있도
록 하는 것으로 정의함.
- 여기서 링크는 재 문서 웹의 하이퍼텍스트와 다르게 RDF(Resource
Description Framework)로 기술된 모든 것(things)들 사이의 연결을 의
미하며, URI는 객체나 개념을 식별하는데 활용됨.
☐ 링크드 데이터 발행을 한 원칙은 다음과 같음.
- 특정 개념(things)을 URI를 사용하여 명명함.
- HTTP를 활용해서 URI로 명명된 자원에 근할 수 있도록 함.
- URI로 정보를 찾았을 때 RDF(S), SPARQL과 같은 표 을 활용해서 유
용한 정보를 제공해야 함.
- 다른 URI를 포함하고 있어서 더 많은 것(개념, things)들을 탐색할
수 있어야 함.
3 KISTI 지식리포트 제40호
2. 도서관 링크드 데이터
1) 도서관 링크드 데이터의 특징
☐ 도서 링크드 데이터는 통 으로 도서 이 리하고 있는 데이터를 변
환하는 것을 기본으로 하며 이 범주에 속하는 데이터는 크게 서지 데이터
와 거 데이터가 있음.
- 서지 데이터(bibliographic data) : 서명, 자, 날짜 등
- 거 데이터(authority data) : 분류, 주제명, 자명, 시소러스, 텍소노미 등
☐ 재 기존의 도서 에서 리하는 데이터를 링크드 데이터로 변환하여 발
행하는 사례와 데이터 범주는 다음과 같음.
- 국국립도서 (서지, http://bnb.data.bl.uk/)
- 스웨덴 종합목록(서지/ 거, http://data.libris.kb.se/)
- 독일국립도서 (서지/ 거)
- 네이처(서지, http://data.- nature.com/)
- VIAF( 거, http://viaf.org/viaf/data/)
- 미국의회도서 ( 거, http://id.loc.gov/)
- Lobid(서지/단체/조직, http://lobid.org/)
- 유로피아나( 거, http://data.europeana.eu/)
☐ 보통 도서 에서 거데이터는 주제명, 자명(개인, 단체명)을 칭하지만 실
제로 국립도서 의 경우 별도로 리하고 있는 다양한 통제 어휘들이 존재
하며 이의 링크드 데이터 변환과 발행도 요함.
- 국립 앙도서 의 경우 도서 부호, 정부기 부호, 국가 부호, 발행국
부호, 한국 학 부호, 외국지역구분 부호, 한국지역구분 부호, 언어구분
부호 등 다양한 통제어휘집이 존재함.
- 이러한 부호표는 외부 공개 시 다양한 분야에서 활용이 가능한 데이터임.
☐ Voß(2012)은 도서 이 가지고 있는 데이터에 한 시각 확 가 필요함을
언 함.
- 비서지형 데이터 열람시간, 근정보 등의 부가 인 정보도 요함.
4도서관 분야의 링크드 데이터 구축 동향
- 특히 고객정보(Patron Information)와 련된 데이터는 좀 더 주의 깊게
살펴볼 필요가 있음.
∙개인 데이터 : 이름, 이메일 주소 등
∙계정 데이터 : 계정상태, 유형, 기한 등 도서 서비스 련 데이터
∙ 출, 약 데이터
- 도서 이용자는 특정 작물(FRBR1)의 Work)이나 개별 자료(FRBR의
Item)에 심이 있을 것이라는 제 하에 고객정보와 문헌정보를 연결시
켜 다른 부가 서비스를 창출할 수 있음.
∙Voß은 PAIA(Patron Account Information API)2)와 온톨로지를 구성
하여 공개하고 있음.
2) 도서관 링크드 데이터 활동
☐ 도서 링크드 데이터(Library Linked Data, 이하 LLD) 련 활동은 기존
도서 데이터를 링크드 데이터 원칙에 맞추어 발행하는 것과 근본 으로
도서 서지 데이터를 다른 에서 바라보고 변화시키려는 2가지로 구분
할 수 있음.
- 자의 경우는 통 으로 서지목록 작성, 표 화와 련된 역할을 담당
하는 국립도서 등의 서지, 통제어휘 리기 과 국제 인 서지목록 공
유 임워크인 OCLC가 표 임.
※ OCLC는 서지정보에 한 링크드 데이터 로젝트를 해 Schema.org를 활
용하고 있음. 이는 웹 환경에서 검색엔진(서비스)들이 보다 잘 서지 정보를 검
색하고 결과를 이용자에게 보여주기 한 노력의 일환으로 링크드 데이터 원
칙에 맞춘 로젝트로 보기는 어려워 별도로 기술함.
- 후자의 경우는 미국 의회도서 을 심으로 연구가 진행 인
Bibliographic Framework가 표 임.
☐ W3C Library Linked Data Incubator Group은 2010년 5월에서 8월까지 활
동한 그룹으로 웹 환경에서 도서 데이터가 로벌 상호운용성 증진을
한 역할을 하기 한 연구를 진행하고 있음.
1) FRBR(Functional Requirements for Bibliographic Records)은 서지레코드의 기능상의 요건을 의미함.
2) http://gbv.github.io/paia/paia.html
5 KISTI 지식리포트 제40호
☐ LLD와 련된 실제 인 지침과 방향을 제시하고자 W3C Library Linked
Data Incubator Group은 2011년 10월 25일에 LLD 최종보고서3)를 발행하
음.
- 이 최종보고서에서 도서 (Library)은 도서 , 박물 , 기록 등 모든
문화유산 기 을 포함하는 용어임.
- 최종보고서에서는 링크드 데이터가 수 있는 혜택, 링크드 데이터 발
행을 해 재 도서 이 가지고 있는 문제와 향후 LLD의 발 을 해
련된 자(기구 포함)들에 한 권고사항을 기술하고 있으며 실제 지침
으로 활용할 수 있도록 구성됨(박진호, 2013b).
- LLD 최종보고서는 도서 데이터가 가지고 있는 문제는 웹의 다른 자
원과 통합이 어려움, 도서 에서만 용 가능한 표 의 활용, 부분의
정보가 보여주기 한 텍스트 심인 , 시맨틱 웹 커뮤니티와 유사 개
념에 한 상이한 용어의 사용, 소수의 기술 공 자에 따른 의존 인 발
이라고 지 하고 있음.
- 마지막으로 최종보고서에서는 도서 데이터의 개방은 데이터 웹을 사
용함으로써 도서 의 데이터 포용력을 높이는 활동이며, 도서 데이터
는 웹에 존재하는 다른 자원과 통합이 되어야 도서 서비스에 한 인
식이 높아질 수 있을 지 하며 <표 3>과 같은 권고사항을 제시함.
☐ LLD 최종보고서에서 사용하고 있는 LLD와 련된 자원의 표 은 다음과
같음.
- 데이터셋(Datasets) : 국 국가서지, 헝가리 국립도서 목록, Open Library,
CrossRef, Europeana 등
- 값 어휘집(Value Vocabularies) : 미국국회주제명표목, AGROVOC4), VIAF
(Virtual International Authority File), DDC(Dewey Decimal Classification
System), GeoNames 등
- 메타데이터 요소셋(Metadata Element Sets) : DCMI(Dublin Core
Metadata Initiative) 메타데이터 용어, RDA의 구성요소, SKOS(Simple
Knowledge Organization System), FOAF(Friend of A Friend) 어휘 등
3) http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/
4) AGROVOC은 Agriculture, Forestry, Fisheries, Food security(농업, 산림, 어업, 식량 보존)의
약자로 농업, 산림, 어업, 식량 보존과 그에 연결된 분야 (예를 들면 지속 가능한 발전과 영양) 안
에서 모든 주제와 관련된 다중 언어로 서비스되는 사전임.
6도서관 분야의 링크드 데이터 구축 동향
☐ 개방형 링크드 데이터는 공유, 확장, 재사용 측면에서 기존의 데이터 근
방식보다 많은 장 을 가지고 있으며, 국립도서 과 같이 신뢰할 수 있는 정
보원으로부터 생산된 데이터들의 연결이 데이터의 가치를 높여 수 있음.
- 특히, 도서 의 자명, 주제명 거데이터는 연결 데이터 사이에 공유
되는 핵심 개체를 명확하게 식별해 주기 때문에 데이터 복을 여
수 있음.
활용 주체 활용 혜택
정보 근자
(연구자, 학생, 이용자)
∙ 도서 과 외부 기 과의 정보자원 연결로 보다 풍부한 탐색이
가능함.
∙ 도서 의 정보를 통해 웹 상의 다른 정보로 연결될 수 있음.
∙ 웹에 구조화된 데이터가 추가되기 때문에 검색엔진 최 화(SEO)
를 통해 향상된 검색 결과 제공이 가능함.
∙ 다양한 분야의 지식베이스에 연결이 가능하여 학제 간 연구에
도움을 수 있음.
정보 리 조직
(도서 등)
∙ 상향식 데이터 발행으로 자 의 정보자산을 기술하는 일의 가치
를 높일 수 있음.
∙ 산 문제로 상세한 수 의 데이터 기술이 부족한 문제를 극복
할 수 있음.
∙ 도서 이 리시스템 등 주류 솔루션을 벗어나 데이터 연결이
가능한 다수의 시스템 선택이 가능하고, 표 연결데이터 활용으
로 보다 다양한 개발자 그룹과 소통이 가능함.
∙ 클라우드 기반의 데이터 활용 근을 한 출발 이 될 수 있으
며, 독립형 시스템에 비해 비용 비 효과가 큼.
∙ 규모가 작은 기 , 개인들이 은 비용으로 가시 인 데이터 연
결 효과를 볼 수 있음. 즉 공개된 데이터를 활용하여 군가 가
치 있는 성과를 낼 수 있는 기회를 제공해 .
정보활동 주체
(사서, 기록담당자 등)
∙ 로벌 공유 데이터를 통해 편목에서의 복 노력을 이고, 자
원 기술의 효율성, 재활용성을 증가시킴.
∙ 타 지식분야의 잘 정리된 기술내용을 활용할 수 있어 사서는 본
인의 문분야에 한 기술노력에 집 할 수 있음.
∙ 구문, 형식이 아니라 데이터의 의미를 기술하는 것으로 향후 지
속가능한 체계로 데이터 리가 가능함.
련 개발자(사)
∙ 도서 에 특화된 데이터에 집 할 필요 없이, HTTP와 같은 웹
로토콜을 활용함으로써 일 된 방식의 데이터 검색과 결합이
가능함.
∙ 링크드 데이터 방식으로 도서 분야를 벗어나 새로운 시장에
활용할 수 있으며, RDF, HTTP를 활용함으로써 특정 소 트웨
어 활용의 부담에서 벗어날 수 있음.
<표 1> 링크드 데이터의 혜택
7 KISTI 지식리포트 제40호
도서관 데이터의 문제점
웹 자원과 통합의 어려움
∙ 도서 데이터는 웹 인터페이스에서 근 가능하지만 날짜, 지리
정보, 사람, 조직 등 수많은 데이터 들과의 연결에는 어려움
이 있음.
도서 분야에서만
활용되는 표
∙ MARC, Z39.50 등은 도서 분야에서만 통용되며 주로 이러한
표 들은 국제도서 회 등의 기 에 의해서 추진됨.
도서 데이터는 자연어
(natural-language)
텍스트로 표 됨.
∙ 도서 데이터는 텍스트 형태로 표 됨.
∙ ISBN과 같은 식별자는 연결을 해 사용이 가능하지만 텍스트
값을 정규화 하는 과정이 필요함.
∙ 통제어휘를 활용하고 있으나 이는 부분 이며, 웹에 연결될 수
있는 URI 표 이 부족함.
도서 계와 시맨틱 웹
커뮤니티 간 상이한
용어 표
∙ 서로 상이한 용어를 사용하여 통합의 과정을 어렵게 할 수 있음.
∙ 도서 에서는 “statements”, 시맨틱 웹에서는 “headings”, “authority
control” 등의 용어를 이해하기 어려움.
소수의 기술 공 자에
의존
∙ 도서 자동화, 이용자 서비스 등의 시스템과 소 트웨어는 소수
의 공 자 심이며, 링크드 데이터 도입의 경우 도서 의 자체
계획보다 업체의 기술개발 계획에 의존해야 하는 경우가 발생함.
<표 2> 전통적 도서관 데이터의 문제
주체 권고내용
도서
리그룹(leadership)
∙ 조기에 링크드 데이터로 발행할 수 있는 데이터셋 확인
∙ 개방형 데이터에 한 토론 장려
표 화기구 참여자
(standards bodies and
participants)
∙ 시맨틱 웹 표 화 부분에 도서 의 참여 확
∙ 링크드 데이터에 부합하는 도서 데이터 표 개발
∙ LLD에 합한 최고의 설계(best practice design) 개발 보
데이터, 시스템 설계자
(data and systems
designers)
∙ 링크드 데이터에 기반한 이용자 서비스 개발과 테스트
∙ 도서 데이터셋에 포함되는 개별자료(items)에 한 URI 생성
∙ 링크드 데이터 어휘집과 그 URI를 리하기 한 정책 개발
∙ 기존 링크드 데이터 어휘집과 매핑 혹은 재활용하여 도서 데이
터 표
사서와 기록
(librarians and archivists)
∙ 링크드 데이터 요소 셋(element sets)과 값 어휘집(value vocabularies)
보존
∙ 장기보존과 큐 이션에 있어서 도서 의 경험을 LD 데이터셋에
용
<표 3> LLD 실현을 위한 권고사항
8도서관 분야의 링크드 데이터 구축 동향
3. 도서관 링크드 데이터 사례
☐ 본 장에서는 LLD의 표 인 3가지 유형의 사례를 살펴보고자 함.
- 자 이 소장하고 있는 데이터를 링크드 데이터 원칙에 맞추어 발행하고
있는 표 인 사례로 국 국립도서 , 독일 국립도서 , 랑스 국립
도서 의 사례를 살펴 .
- 데이터 웹에서 명확한 근 과 기 을 제시해 수 있는 값 어휘집
을 제공하고 있는 표 사례인 OCLC를 살펴 .
- 링크드 데이터를 넘어 서지 정보자원을 데이터 웹에 어떻게 표 하는가에
한 개념 인 근을 시도하고 있는 LC Bibliographic Framework 사례
를 살펴 .
☐ 본 장에서 소개하는 링크드 데이터 서비스 사례는 기존에 도서 에서 수행
하지 않았던 새로운 서비스가 아닌 디지털서비스의 일종임.
1) 영국 국립도서관
☐ 자 서지 정보를 링크드 오 데이터 형태로 개방하고 있으며, 재 단행
형태의 도서자료와 연속간행물에 한 데이터 서비스를 수행하고 있음.
- Free Data Services라는 명칭으로 서비스 임.
- 근 URL : http://www.bl.uk/bibliographic/datafree.html
- 스키마 정보 URL : http://www.bl.uk/schemas/
- 체 일 다운로드(Bulk downloads, RDF/XML과 N-Triples) URL :
http://www.bl.uk/bibliographic/download.html
9 KISTI 지식리포트 제40호
<그림 1> 영국 국립도서관 단행본 링크드 데이터 모델
<그림 2> 영국 국립도서관 연속간행물 링크드 데이터 모델
10도서관 분야의 링크드 데이터 구축 동향
☐ 재 약 280만 건의 원천 코드를 상으로 총 93,583,853건의 트리 을 제
공하고 있으며, 기존에는 데이터 활용을 한 세 가지의 서비스를 제공
하 으나 재는 데이터서비스를 한 단일 웹사이트(http://bnb.data.bl.uk/)
로 통합되었음.
☐ 국 국립도서 에서 링크드 데이터 기술을 해 활용하고 있는 어휘집은
다음과 같음.
- Bibliographic Ontology, Bio, British Library Terms, Dublin Core,
Event Ontology, FOAF, ISBD, Org, OWL, SKOS, RDF Schema,
WGS84 Geo Positioning, RDA
☐ 국 국립도서 링크드 데이터 자원과 연결된 외부 링크드 데이터셋은 다
음과 같음.
- VIAF, LCSH, Lexvo, GeoNames(출 국 표 ), MARC(국가/언어코드),
Dewey.info, RDF Book Mashup
☐ 국 국립도서 사례에서의 시사 은 다음과 같음.
- 재 국 국립도서 에서는 데이터 서비스를 한 별도의 사이트를 운
하고 있는데, 링크드 데이터는 이러한 데이터 서비스의 일부로 자유롭
게 활용이 가능한 데이터 서비스로 분류되어 서비스 되고 있음.
- 국 국립도서 의 데이터서비스 사이트(http://bnb.data.bl.uk/)에서 메타
데이터 서비스 메뉴의 Free Data 메뉴를 통해 이용이 가능함.
- 단행본, 연속간행물 등 통 인 도서 의 리 상 객체를 하나의 도
메인으로 보고 모델링하 음.
2) 독일 국립도서관
☐ 독일 국립도서 의 링크드 데이터 로젝트는 2010년 거데이터의 변환을
시작으로 2012년 서지데이터에 한 링크드 데이터화로 이어짐.
- 근 URL : http://www.dnb.de/EN/lds
- 체 일 다운로드(Dumps) URL :
http://datendienst.dnb.de/cgi-bin/mabit.pl?userID=opendata&pass=opend
ata&cmd=login
11 KISTI 지식리포트 제40호
☐ 거데이터(GND, Gemeinsame Normdatei)는 기존에 존재하던 PND, 주제
명(SWD), 종합 거(GKD), 독일음악 기록물 표목 거를 통합한 형태로 독
일어 정보자원에 한 근성을 향상시켜 독일어권 국가의 다양한 기 에
서 활용할 수 있도록 함.
☐ 서지데이터에 한 링크드 데이터화는 악보, 핵심 장서, 연속간행물 목록
정보, 일반 , 신문, 연속간행물 모두를 포함하고 있으며, 링크드 데이터
로 변환하기 한 모델링 작업과 변환에 합한 데이터 선정을 해 독일
어권 국가 도서 특별 원회를 운 하고 있음.
☐ 독일 국립도서 에서 링크드 데이터 기술을 해 활용하고 있는 어휘집은
다음과 같음.
- Dublin Core terms, Dublin Core elements, Bibliographic Ontology,
RDA, ISBD, RDF Schema, Upper Mapping and Binding Exchange
Layer (Umbel), FOAF, Schema.org
☐ 독일 국립도서 의 링크드 데이터 자원과 연결된 외부 링크드 데이터셋은
다음과 같음.
- MARC-Code, Dewey.info, 내부 서지정보 링크(http://d-nb.info)
☐ 독일 국립도서 사례에서의 시사 은 다음과 같음.
- 독일 국립도서 은 재 링크드 데이터 변환 서비스 외에 미국 의회도
서 심의 LC Bibliographic Framework 로젝트에 참여하고 있으며,
향후 새로운 데이터 모델링과 어휘집을 활용한 링크드 데이터 서비스를
기 할 수 있음.
- 재 데이터에 한 발행서비스와 더불어 미래지향 인 서지 목록에
한 연구를 동시에 진행하고 있음.
3) 프랑스 국립도서관
☐ 랑스 국립도서 은 소장 주요 목록은 물론 디지털도서 서비스인 갈리
카(Gallica)를 포함한 링크드 데이터 서비스를 제공하고 있음.
12도서관 분야의 링크드 데이터 구축 동향
- 근 URL : http://data.bnf.fr/
- 체 일 다운로드(Dumps) URL :
http://echanges.bnf.fr/PIVOT/databnf_all_rdf_xml_2013_09_25.tar.gz?use
r=databnf&password=databnf
☐ 랑스 국립도서 에서 링크드 데이터 기술을 해 활용하고 있는 어휘집
은 다음과 같음.
- RDF, RDF Schema, SKOS, DC, FOAF, RDA Group2, RDA Relationships,
RDA Group1, OWL, ORE
☐ 랑스 국립도서 의 링크드 데이터 자원과 연결된 외부 링크드 데이터셋
은 다음과 같음.
- LCSH(id.loc.gov), Dewey.info, DCMI type, DBpedia, VIAF, IdRef, Wikipedia
- 랑스 국립도서 링크드 데이터는 FRBR 모형을 기본 모델링에 반
하고 있음.
☐ 랑스 국립도서 사례에서의 시사 은 다음과 같음.
- 데이터 모델링에 FRBR 개념을 반 하고 있어 보다 서비스 지향 인
근 방식을 취하고 있음.
- 향후 LC Bibliographic Framework 근에 있어 타 도서 보다 유연하
게 처 가능한 구조를 가지고 있음.
13 KISTI 지식리포트 제40호
<그림 3> 프랑스 국립도서관 RDF 데이터 모델
4) OCLC(Online Computer Library Center)
☐ OCLC는 1967년 설립되어 세계 171개국 지역의 72,000개 도서 과
연계되어 목록, 참고자원, 자자원 통합검색과 도서 자원 공유 보존,
웹 서비스 활동을 수행하는 비 리 기구임.
☐ OCLC가 링크드 데이터로 개발하여 운 하고 있는 데이터 자원으로는
DDC, FAST(Faceted Application of Subject Terminology), VIAF가 있음.
14도서관 분야의 링크드 데이터 구축 동향
링크드 데이터 유형 링크드 데이터 특징
VIAF
(Virtual International
Authority File)
∙ URL : http://viaf.org
∙ 제공형태 : HTML, RDF/XML
DDC
(Dewey Decimal
Classification)
∙ URL : http://dewey.info
∙ 제공형태 : HTML/RDFa, RDF/XML, Turtle, JSON-SPARQL
FAST
(Facet Application of
Subject)
∙ URL : id.worldcat.org/fast
∙ 제공형태 : HTML, RDF/XML - Download
<표 4> OCLC 링크드 데이터 자원
☐ OCLC는 2012년 6월부터 WorldCat.org 코드에 Schema.org 태그를 추가
하여 도서 자원에 한 검색엔진의 근성을 향상시킴.
- 동년 8월에는 WorldCat에서 활용 가능한 약 8천만건의 서지 링크드 데
이터 트리 을 발행하 으며, 체 데이터셋을 다운로드5) 할 수 있도록
하고 있음.
☐ WorldCat 링크드 데이터 서비스
- WorldCat은 Schema.org의 용어집을 활용하여 서지 정보에 한 구조화
된 데이터를 제공함.
- 이는 웹 검색엔진(서비스)에서 WorldCat 서지 정보에 한 근성을 강
화하는 효과를 갖는데, 이는 서지 정보 기술을 한 OCLC의 1세 링
크드 데이터 모델임.
- OCLC는 사서의 에서 Schema.org의 단 을 해결하기 해 “도서
”, “소장”이라는 객체를 설명하기 한 어휘를 확장하고, 콘텐츠와 캐
리어(carrier)를 분리하는 시도를 함.
- W3C Community and Business Groups 내에 “Schema Bib Extend
Community Group”은 Schema.org를 확장하여 서지 정보를 구조화하고
공유하기 한 보다 향상된 방법을 찾고자 하는 시도임6).
- 근본 으로 OCLC의 데이터셋은 FRBR 개념에 기 하고 있으며, 이는
미국 의회도서 의 LC Bibliographic Framework 로젝트와 유사한 개
념 근을 가짐.
5) http://purl.oclc.org/dataset/WorldCat/datadumps/WorldCatMostHighlyHeld-2012-05-15.nt.gz
6) http://www.w3.org/community/schemabibex/
15 KISTI 지식리포트 제40호
<그림 4> WorldCat과 Schema.org를 활용한 WorldCat.org 서비스 효과
<그림 5> WorldCat.org 서지정보 검색결과
16도서관 분야의 링크드 데이터 구축 동향
<그림 6> OCLC 데이터셋 스키마
☐ OCLC 사례에서의 시사 은 다음과 같음.
- 값 어휘집(Value Vocabularies)에 속하는 VIAF, DDC, FAST 데이터를
제공하고 있는데, 이를 통해 다양한 데이터셋들이 상호 연결될 수 있는
연결 역할이 가능하며 기존의 도서 데이터셋( 자, 주제 등)들의 활
용성을 극 화 시킬 수 있음.
- Schema.org 어휘집을 활용하여 웹에서 OCLC 데이터에 한 검색 최
화를 도모하고 있으며, 이 은 일반 인 도서 에서의 링크드 데이터 발
행이 자 데이터를 RDF 일로 출 하고 공유하는 형식인 것을 감안
할 때 차별화 된 방식임.
- 단순히 링크드 데이터로 변환하여 소장 정보를 발행하는 것 외에 분명
한 목 을 가지고 링크드 데이터를 발행할 수 있는 용어집과 발행 방법
(RDFa)을 선택한 에서 시사 이 있음.
17 KISTI 지식리포트 제40호
5) LC Bibliographic Framework
☐ 미국 의회도서 은 2011년 5월에 서지 임워크 이니셔티 를 발표하고
장기 인 에서 “네트워크”라는 개념을 심에 두고, 서지 정보들이 끊
임없이 상호 연결되어 있는 새로운 서지 환경을 구축하고자 함.
☐ LC Bibliographic Framework(이하 BIBFRAME)은 어떤 형태의 내용 표
이나 콘텐츠 표 ( , RDA)도 수용할 수 있도록 구성되어야 하지만 역시
도서 간에 데이터 교환이 가능한 모델을 지향함.
☐ BIBFRAME( 재 안)의 목 은 미래의 정보자원과 MARC21로 인코딩 된
통 인 서지데이터를 모델링 할 수 있는 패턴을 제공하는 것임.
- 이 패턴은 웹을 기본 인 틀로 활용하여 기존 서지정보의 통합을 가능
하게 하고, 링크드 데이터 등을 통해 기존 데이터에 한 정제 재개
발과 같은 안 인 근이 가능하도록 함.
- MARC21은 도서 간의 데이터 교환을 해 개발된 가장 최근의 데이
터 포맷임.
- MARC21 형식을 링크드 데이터 모델로 반 함으로써 데이터의 유용성
이 높아질 수 있고, 데이터 활용 범 가 도서 의 역에서 문화유산 기
으로 확장될 수 있음.
☐ BIBFRAME을 연구 활동, 기술개발 등의 으로 보는 것도 요하지만
기존의 서지데이터가 갖는 역사 맥락을 수용하여 새로운 환경(웹)에서의
정보 데이터 생태계를 구축하기 한 노력으로 이해해야 함.
☐ BIBFRAME은 다음과 같은 을 고려하여 설계되었음.
- 미래의 목록 정보, 새로운 이용자 시나리오와 다양한 정보출처 등에
응하기 한 유연성 확보
- 분산된 정보들을 연결하고 표 하기 한 아키텍처 모델로서의 웹
- 도서 외부의 사회 , 기술 변화에 한 도입
- 도서 커뮤니티 내부의 사회 , 기술 확장
- 링크드 데이터로 서지 정보를 표 하기 한 이 의 시도
- 기계 인 작업을 한 기술 도입과 주제 문가로서 사서의 역량 수용
18도서관 분야의 링크드 데이터 구축 동향
- 도서 , 출 계, 기록 , 박물 커뮤니티에서의 서지 정보를 모델링하기
한 이 의 노력
- MARC의 다음과 같은 특징을 고려하여 설계함.
∙ 작물의 지식 본질과 련된 데이터의 생성, 리, 공유, 보존
∙ 작물의 실제 인스턴스와 련된 데이터의 생성, 리, 공유, 보존
∙제어번호, 코드 제어코드와 같은 메타데이터의 생성, 리, 공유, 보존
☐ BIBFRAME의 핵심 클래스는 다음과 같음.
- Creative Work : 목록화 된 자료의 개념 본질을 반 하고 있는 자원
- Instance : 작물을 구 한 개별 자료 등을 반 하고 있는 자원
- Authority : 사람, 장소, 주제, 조직 등을 포함한 거 자원으로 작물이
나 인스턴스에 반 되어 계를 정의하고 있는 개념 자원
- Annotation : BIBFRAME의 다른 자원을 표 할 수 있는 추가 인 자원
으로 도서 의 소장정보나 표제 그림, 논평 등의 자원
<그림 7> BIBFRAME Work-Instance 중심 링크드 데이터 모델
19 KISTI 지식리포트 제40호
<그림 8> BIBFRAME Work-Instance-Annotation 링크드 데이터 모델
☐ BIBFRAME의 구성은 FRBR의 작(work)과 구 (manifestation) 계를
심으로 FRBR2, 3 모델을 목한 형태를 가짐.
<그림 9> BIBFRAME의 텍스트, 비텍스트형 자원에 대한 개념 모형
20도서관 분야의 링크드 데이터 구축 동향
4. 도서관 링크드 데이터 구축의 필요성
1) 데이터 중심의 웹 생태계
☐ “연결”의 에서 재 웹의 심은 “Web of Documents”, 즉 HTML 구
문(syntax)이 심이 되는 문서 간 연결로 이루어진 생태계이며, 링크드 데
이터는 “Web of data” 즉 XML, RDF/OWL을 활용하여 의미(semantic)가
심이 될 수 있도록 웹에 표 된 다양한 객체/개념을 연결하여 데이터 간
의 연결이 심이 되는 새로운 생태계임.
- 링크드 데이터는 결국 웹에 새로운 데이터 심 계층을 형성하게 되고
웹은 그 자체로 로벌 데이터베이스 역할을 수행함.
☐ <그림 10>은 2011년 9월 19일 재 링크드 데이터 황을 나타냄.
- 데이터셋 황과 데이터셋 간의 연결 계를 보여 .
- 각 노드는 링크드 데이터 형태로 발행된 각각의 데이터셋을 나타냄.
- 연결선(화살표)은 RDF 링크로 두 개의 연결된 데이터셋에 포함된 개별
항목(items)들의 계를 표 함.
<그림 10> 링크드 데이터 현황(2011년 9월 19일 현재)
21 KISTI 지식리포트 제40호
☐ <표 5>는 2011년 9월 19일 재 링크드 데이터 클라우드에 포함된 데이터
들의 도메인별 황을 보여 .
- 가장 많은 데이터셋을 포함하고 있는 도메인은 출 이며, 정부 도메인에
속하는 데이터가 두 번째 비 을 차지함.
- 반면, 정부 도메인은 체 트리 의 양 규모가 42.09%로 인 수치
를 형성하고 있음.
- RDF 링크 수는 특정 도메인내의 데이터 소스에서 다른 데이터 소스로
설정되어 나가는 링크(out-links)를 의미함.
- 가장 많은 링크(out-links) 비 은 생명공학이지만 출 도메인의 데이
터 역시 27.76%로 두 번째 비 을 차지함.
도메인데이터셋
개수 트리플수 비율(%) 외부링크수 비율(%)
Media 25 1,841,852,061 5.82 50,440,705 10.01
Geographic 31 6,145,532,484 19.43 35,812,328 7.11
Government 49 13,315,009,400 42.09 19,343,519 3.84
Publications 87 2,950,720,693 9.33 139,925,218 27.76
Cross-domain 41 4,184,635,715 13.23 63,183,065 12.54
Life sciences 41 3,036,336,004 9.60 191,844,090 38.06
User-generated
content20 134,127,413 0.42 3,449,143 0.68
합계 295 31,634,213,770 100 503,998,829 100
<표 5> 도메인별 링크드 데이터 현황
출처 : http://lod-cloud.net/state/
☐ 데이터를 심으로 하는 새로운 웹 생태계 구성 에서 지식정보 리기
은 자 이 소유, 리하고 있는 데이터를 링크드 데이터 원칙에 맞추어
발행하는 과정을 고려해야 함.
- 리하고 있는 데이터 형태(구조 , 비구조 )와 특징( 작권 유무 등)
악이 필요함.
- 링크드 데이터 형태로 발행했을 때 가장 효과 인 데이터가 무엇인지
악해야 함.
22도서관 분야의 링크드 데이터 구축 동향
☐ 동일 도메인 혹은 타 도메인과의 인터 링킹(inter-linking)으로 자 의 데이
터에 보다 풍부한 근 을 수 있다는 필요성 외에 새로운 데이터 웹
구축에 기여하다는 측면에서의 시도에 을 두는 것이 필요함.
☐ 데이터를 심으로 하는 새로운 웹 생태계 구성은 링크드 데이터 원칙에
맞추어 재 리하고 있는 데이터를 웹에 공개하는 에서의 근 으
로 앞서 기술된 국립도서 들의 사례가 표 임.
2) 링크드 데이터의 실용성
☐ 링크드 데이터에 한 심과 링크드 데이터 원칙에 하여 생산된 데이터
의 증가는 다른 문제 과 근 을 제시함.
- 링크드 데이터의 증가에 따라 객체와 객체(개념과 개념)를 이어주고
계를 보다 상세히 기술할 수 있도록 해주는 용어집의 선택 문제가 생김.
☐ 링크드 데이터를 기반으로 한 웹의 성장으로 수많은 RDFS/OWL 기반의
용어집들이 존재하며, 용어집은 SKOS, DC, FRBR과 같은 표 뿐만 아니
라 FOAF, Event Ontology와 같이 사실상의 표 으로 통용되고 있는 것들
도 있음.
- 재 수많은 용어집들이 생성되고, 상호 연결되어 웹상에 발행되면서 새
로운 용어집 생태계를 이루고 있음.
☐ 링크드 데이터 자체도 리가 필요한 하나의 데이터라는 의 변화가 필
요하며, 이는 표 으로 Linked Open Vocabularies(이하 LOV)와 같은
로젝트가 보여주는 다양한 서비스에서 확인이 가능함.
☐ LOV(http://lov.okfn.org)는 어휘 생태계에 쉽게 근할 수 있는 방법을 제
공하는데, OKF(Open Knowledge Foundation)의 지원으로 Datalift7) 로
젝트의 결과로 개발되었음.
7) 프랑스 국립 연구청(L'Agence nationale de la recherche)의 지원 하에 수행된 실험적 연구프로
젝트로 프로젝트의 목적은 관계형 DB, CSV, XML 등 다양한 구조적 형태의 원천 소스를 웹상에
상호 연결된 시맨틱 데이터로 변환할 수 있도록 하는 것임. 이용자는 이 프로젝트에서 개발된 툴
로 데이터를 출판하기 위한 온톨로지 선택 – 데이터를 적절한 형태의 RDF(선택한 온톨로지를 활
용해서 RDF 형태로) 변환 – 링크드 데이터로 출판 – 다른 데이터 소스와 인터링킹 등의 기능을
수행할 수 있음.
23 KISTI 지식리포트 제40호
☐ LOV의 주 이용자 계층은 어휘 이용자와 리자 모두를 상으로 함.
- 어휘 이용자는 자신의 데이터를 가장 잘 기술할 수 있는 합한 어휘를
선택해야하고, 리자는 자신이 리하는 용어집에 한 가용성을 확인
하고 이용자 피드백을 통해서 장기 으로 안정 인 용어집 운용이 가능
하도록 할 수 있음.
- LOV는 어휘집 생태계에서 각 어휘들의 품질 평가와 검색을 한 랫폼
인 동시에 이 생태계를 장기 으로 지속가능하게 유지하기 한 활동임.
☐ LOV는 기본 으로 LOD 클라우드(http://linkeddata.org/)에 존재하는 RDFS
용어집이나 OWL 온톨로지를 포함하고 있으며, 다음의 조건을 충족하는 용
어집을 수집(LOV에 직 신청도 가능)함.
- RDFS, OWL과 시맨틱 웹 온톨로지 언어 하나로 표 되어야 함.
- 웹에서 자유롭게 활용 가능하도록 출 되어야 함.
- 네임 스페이스의 URI를 활용하면 내용 상(content negotiation)에 의한
검색이 가능해야 함.
- 다른 용어집의 일부 혹은 체로 통합과 재사용이 용이해야 함.
☐ LOV가 제공하는 기능은 다음과 같음.
- LOV Aggregator : 용어집과 용어에 한 Endpoint 제공, 각 용어집의
재 상태를 일 단 로 조회할 수 있고 다운로드가 가능함.
<그림 11> LOV Aggregator 화면
24도서관 분야의 링크드 데이터 구축 동향
- LOV Suggest : LOV 목록에 포함시키기 한 새로운 용어집 등록 기능
을 제공함. 용어집에 한 유효성 검증 후에 등록이 가능함.
<그림 12> LOV Suggest 화면
- LOV Search : LOV 검색으로 요소명(속성, 클래스, 용어집 등)에 한
검색이 가능하며, 검색한 요소명에 한 도메인별, 유형별, 용어집별 필
터링을 지원함. 다음과 같은 평가 지표를 가짐.
∙ 질의어와 요소명(element labels) 련성
∙ 요도와 일치된 요소명
∙ LOV 데이터셋에서 요소의 발생 건수
∙ 요소를 참조하고 있는 LOV 데이터셋에서 용어집의 수
∙ LOC에서 요소의 발생 건수
<그림 13> LOV Search 화면
25 KISTI 지식리포트 제40호
☐ 링크드 데이터 역시 리가 필요한 데이터라는 은 단순히 자 의 데이터
를 링크드 데이터로 서비스한다는 범 를 벗어나 링크드 데이터라는 개념
에 근하고자 하는 이들과 연구자 등에게 다른 형태의 서비스를 제공
해 수 있음.
- 이러한 근 을 갖는 정보 리기 은 해당 도메인에 특화된 링크드 데
이터 모델 제공과 더불어 링크드 데이터에 한 학문 , 실용 근을
가능하게 함.
☐ Blumauer(2013)는 링크드 데이터가 학문 인 역은 물론이고 일반 인 활
용을 한 근 으로의 역할을 수행하기 해서는 지 과 같은 형태의 일
반 인 지식이 아니라 보다 세부 도메인의 지식을 달할 수 있는 신뢰할
수 있는 링크드 데이터 클라우드가 필요함을 언 함.
- 표 인 로 독일 국립도서 링크드 데이터 클라우드와 클린 에 지
링크드 데이터 클라우드를 제시함.
<그림 14> Clean Energy Linked Open Data Cloud
26도서관 분야의 링크드 데이터 구축 동향
- 기에 구축된 링크드 데이터 클라우드는 다시 한 번 재 검이 필요하
며, 첫 단계로 개방형 데이터인 것과 아닌 것을 보다 명확히 표시하고,
두 번째로 클라우드 내 데이터셋의 품질과 신뢰성에 책임을 지고 있는
자(기 )를 보다 명확히 할 필요가 있음.
- 한, 링크드 데이터 클라우드에서는 데이터가 부가 아니며, 그 뒤에
존재하는 사람과 조직이 요한데, Trusted Clean Energy Lod Cloud의
경우 연결된 데이터셋을 리하는 조직들은 공통의 데이터 인 라 기반
에서 효율 인 업 작업을 수행하고 있음.
☐ 하나의 데이터로써 링크드 데이터와 실용 활용 기반 구축은 단순히 소장
데이터에 한 링크드 데이터 개방 외에 링크드 데이터를 활용하고자 하는
자(조직)에게 효과 이고 효율 인 근 (LOV와 같은 링크드 데이터 분
석, 평가)을 제시해 필요가 있음. 링크드 데이터의 링크가 가장 괴력
을 발휘할 수 있는 것은 데이터 뒤에 연결되어 있는 조직 간의 연계 력
인 라임을 주지해야 함.
3) 링크드 데이터를 통한 접근성 향상
☐ 링크드 데이터는 웹이라는 랫폼에서 소통하기 한 방식 의 하나로,
도서 의 경우 MARC, OAI, OpenAPI 등 다양한 방식으로 데이터를 개방
하고 도서 간 혹은 타 기 과 데이터를 교환해 왔음.
- 그러나 이러한 소통 방식은 직 으로 웹을 랫폼으로 활용하지는 않
으며, 데이터 간의 소통을 한 표 (속성) 역시 MARC, MODS 등 도
서 도메인에서만 가능한 한계가 있음.
☐ 링크드 데이터 원칙을 수하여 웹에 구조화된 데이터를 발행하고 공유하
고 재사용할 수 있는 기회를 제공하는 것은 가장 근본 인 데이터 웹을 만
드는 방식이지만, 기존의 소통방식(OAI 등) 역시 유지해야 하며, 구조화된
데이터의 개방과 활용이라는 에서 OData(Open Data Protocol)와 같은
방식도 고려한 데이터 랫폼 구축에 을 둘 필요가 있음.
- OData(개방형 데이터 로토콜)는 인터넷을 통해 데이터를 송하는
로토콜로 웹상에서 손쉽게 데이터를 조회, 수정 등이 가능한 웹 로토
콜(http://www.odata.org)임.
27 KISTI 지식리포트 제40호
☐ 구조화된 데이터의 발행과 근 향상은 웹상에 구조화된 데이터를 발행
하고 링크드 데이터 방식 이외의 다양한 웹을 기반으로 하는 소통방식에
근할 필요가 있음을 강조한 것으로, 뿐만 아니라 링크드 데이터는 발행뿐
만 아니라 실제로 서비스에 활용이 가능한 데이터임을 주지해야 함.
<그림 15> OECD Odata API 예제 - 메타데이터 조회
(http://stats.oecd.org/OECDStatWCF_OData/OData.svc/$metadata)
☐ 링크드 데이터에 한 근 방식 하나로 고려해야 하는 것 의 하나는
웹에서 특히, 검색엔진에서의 근성 향상 임.
- OCLC의 사례처럼 부분 이용자들의 근 경로인 Google 등 검색엔진
(서비스)에서의 근성 향상을 한 Shema.org 용어집 참조와 RDFa
용 등 고려 필요
☐ 링크드 데이터는 데이터의 발행 방식 의 하나인 동시에 활용이 가능한는
살아있는 데이터 셋임.
☐ BBC에서는 BBC Music, BBC Programmes와 같은 링크드 데이터를 활용
한 서비스를 개시하여 제공하고 있음(<그림 16> 참조).
- 한 BBC에서는 2012년부터 링크드 데이터를 활용하여 BBC News를
한 시맨틱 로토타이핑 랫폼인 BBC News Juicer 시작함.
28도서관 분야의 링크드 데이터 구축 동향
<그림 16> 링크드 데이터 기반 BBC Music The Beatles 서비스
<그림 17> BBC News Juicer 서비스
29 KISTI 지식리포트 제40호
5. 결론 및 제언
☐ 본 보고서는 도서 의 링크드 오 데이터 서비스 동향을 살펴보고 향후
발 된 서비스 방안을 제시하는 것이 목 임.
☐ 이를 해 간단히 시맨틱 웹과 링크드 데이터에 한 정의와 링크드 데이
터의 원칙을 살펴보고, 도서 링크드 데이터의 가장 실용 인 지침인
W3C Library Linked Data Final Report의 요 내용을 검하 으며,
표 인 도서 링크드 데이터 사례를 3가지 에서 제시함.
- 첫 번째 은 국 등 국립도서 들의 소장정보에 한 링크드 데이
터화와 발행이며, 두 번째는 OCLC의 WorldCat, VIAF 등과 같이 웹에
서의 근성 향상과 값 어휘집 제공 사례, 세 번째는 미국 의회도서 의
BIBFRAME으로 데이터 웹에 한 개념 인 근 사례임.
☐ 이 와 별개로 도서 이 가지고 있는 데이터가 단순히 서지, 거 데이터뿐
만 아니라 이용자와도 련된 데이터가 존재하며 이의 유의미한 활용이 가
능하다는 도 제시함.
☐ 링크드 데이터를 기반으로 발 된 서비스 방향 설정을 해서 3가지의
근 을 제시함.
- 첫 번째는 데이터를 심으로 하는 새로운 웹 생태계 구성에 참여할 필
요가 있으며 이를 해서는 리, 소장하고 있는 데이터에 한 분석과
링크드 데이터 원칙을 수한 데이터 발행이 필요함을 언 하 음. 이것
은 웹에 새로운 데이터 생태계를 구성하는데 참여하고 있다는 거시 인
과 발 방향 설정이 필요함을 지 한 것임.
- 두 번째는 하나의 데이터로써 링크드 데이터를 바라볼 필요가 있으며, 이
는 연구자(기 ) 혹은 링크드 데이터를 실용 으로 활용해야하는 자(기 )
에게 효율 인 근 을 제시해 수 있는 서비스 이 필요함을 지
한 것임. 한 링크드 데이터의 핵심인 연결은 데이터의 연결뿐만 아니
라 뒤에 존재하는 조직 인 인 라의 유 와 결속이 요함을 지 하 음.
- 마지막은 구조화된 데이터의 발행과 근 향상으로 링크드 데이터가
기존의 소통방식과 다른 형태를 취하고 있으나 역시 데이터를 교환하고
30도서관 분야의 링크드 데이터 구축 동향
상호운용성을 확보하고 데이터의 재사용성과 활용성을 높인다는 에
서 동일선상의 개방형 데이터 정책으로 볼 필요가 있음을 지 한 것임.
한 이미 개방된 링크드 데이터를 직 으로 업무나 서비스에 활용할
수 있는 방안 수립도 필요함을 언 하 음.
☐ 본 보고서의 범 는 도서 을 기본 도메인으로 하고 있으며, 주요 내용은
정보자원 리 기 이 개념 으로 링크드 데이터에 해 근할 수 있도록
하고 재 시 에서 필요한 것이 무엇이며, 이를 바탕으로 향후 추진해야하
는 방향과 과제가 무엇인지를 알아보는데 을 두고 있음.
☐ 링크드 데이터가 웹에서 보다 효과 인 소통 방식임을 직시하고, 링크드 데
이터 발행자( 리자), 소비자로써의 역할로 근하여 정책을 설정하고 실행
계획을 수립하는 것이 필요함.
31 KISTI 지식리포트 제40호
<참고문헌>
박진호 (2013a, 7월). 도서 은 웹에 존재하는가? : 링크드 데이터, 로벌 데이
터베이스. 국가 자도서 세미나. 경기도 : 국가기록원
박진호. (2013b). 도서 데이터의 링크드 데이터(Linked Data) 변환과 인터링
킹(interlinking)을 통한 정보연계 확장성에 한 연구 : 국립 앙도서
서지, 주제명, 자명 데이터를 심으로. 석사학 논문, 성균 학교,
서울.
Berners-Lee, T., Hendler, J., & Lassila, O. (2001). The semantic web.
Scientific american, 284(5), 28-37.
Berners-Lee, T. (1998). Semantic web road map, September 1998. W3C
Draft http://www. w3. org/DesignIssues/Semantic. html.
Berners-Lee, T. (2007). Giant global graph. online posting, Networks,”
Proceedings of the National Academy of Sciences of the United
States of America, 98, 404-9.
Berners-Lee, T. (2011). Design issues: Linked data (2006). URL
http://www. w3. org/DesignIssues/LinkedData. html.
Blumauer, Andreas. (2013, June 7). The LOD cloud is dead, long live the
trusted LOD cloud. Retrieved from http://blog.semantic-web.at/2013/
06/07/the-lod-cloud-is-dead-long-live-the-trusted-lod-cloud/
Voß, Jakob. (2012, November). Encoding Patron Information in RDF. Paper
presented at the Semantic Web in Libraries(SWIB12) Conference,
Cologne, Germany.
W3C. (n.d.). W3C SEMANTIC WEB ACTIVITY. Retrieved from
http://www.w3.org/2001/sw/
◀ 저 자 ▶
현 미 환 ⋅KISTI NDSL서비스실 선임연구원
김 완 종 ⋅KISTI NDSL서비스실 선임연구원
이 혜 진 ⋅KISTI NDSL서비스실 선임연구원
유 수 현 ⋅KISTI NDSL서비스실 선임연구원
김 혜 선 ⋅KISTI NDSL서비스실장
박 진 호 ⋅성균관대학교 문헌정보학과
KISTI 지식리포트 제40호
도서관 분야의 링크드 데이터 구축 동향
인 쇄 2014년 1월 6일
발 행 2014년 1월 7일
펴낸곳
펴낸이 박영서
편집인 김혜선
주 소 서울시 동대문구 회기로 66
고객센터(ARS) 080-969-4114
등 록 1991. 2. 12, 제5-258호
ISBN 978-89-294-0464-2 93020
인쇄처 승림디엔씨
※ 본 연구의 내용은 본 연구원의 공식적인 견해가 아닌 참여 연구원들의 의견임을 밝혀둔다.
□ KISTI 지식리포트 발행 목록
호 서명 저자 발간일
1 학술지 수집 정책 수립을 한 국내 황 분석 이재윤, 김혜선, 이혜진 2009.06.11
2 국내 과학기술지식의 로벌 확산 략 서태설, 최 규 2009.09.04
3 국가 과학기술 진흥을 한 KISTI의 략 정보자원 개발방안 황혜경, 최호남, 윤희윤 2009.09.21
4 학술논문 오 액세스를 한 공공 근정책 방향 서태설, 허 선, 노경란 2009.10.23
5 과학데이터의 공유와 활용 이상환, 심원식 2009.11.10
6 E.infrastructure기반 국가 R&D 정보서비스의 지능화 방안 송인석, 오세홍 2009.12.04
7 한국과학기술인용색인서비스(KSCI)의 황 발 략 최선희, 이재윤 2010.01.29
8 학술정보센터의 새로운 서비스 모델 : 오 액세스 출 노경란, 이혜진 2010.02.11
9 과학기술정보의 아카이빙 체제 구축 황혜경, 이선희, 최호남, 서혜란 2010.02.16
10 세계 주요 과학기술 정보기 의 최근 동향이상환, 노경란, 김혜선,
황혜경, 정은경2010.03.02
11 과학기술 정보자료 보존 리 : 황분석 미래 측이선희, 황혜경, 류범종,
윤희윤, 김석2010.06.30
12 리포지터리 사례분석 시사 도출 이상기, 정 미 2010.10.07
13 디지털 콘텐츠 유통을 한 작권 쟁 분석 유수 2010.10.07
14 이공계 학 교수의 과학기술정보 이용 황 김환민, 김재훈 2010.12.02
15 계량서지 분석용 공개 소 트웨어 활용 방안 최선희, 김희정, 이재윤 2011.01.24
16 2010년도 한국 과학자의 SCI 논문 계량분석 김완종, 노경란, 박민수, 최 규 2011.04.06
17 국내 과학기술정보 이용실태 조사 분석 박민수, 이상환, 최 규, 정정수 2011.04.08
18 국내 과학기술정보 이용자 니즈 형태 연구 박민수, 이상환, 최 규, 정정수 2011.04.08
19 학술지 유통환경 변화와 국내 학술지의 국제화 서태설, 김규환, 최 규 2011.06.07
20우리나라 SCI 논문의 향력 분석 : NCR for Korea 1981-2010을 기 으로
김완종, 노경란, 최 규, 박민수 2011.08.17
21 연구자들의 소셜 미디어 이용 노경란, 최 규 2011.10.19
22 연구자를 한 소셜 미디어 활용 가이드 노경란, 최 규 2011.10.19
23 서비스 사이언스 기반 과학기술 콘텐츠 서비스 방안김지 , 신기정, 황혜경,
조부연2011.10.26
24 효율 연구를 한 소셜 미디어 활용 노경란, 유수 , 최 규 2011.11.09
25 SEO(검색엔진최 화)를 통한 검색순 올리기 략 미환, 이태석, 문 수, 권정 2011.11.11
26 연구자 업지원형 정보서비스 사례연구이혜진, 미환, 김혜선,
박민수, 최 규2011.12.01
27과학기술 R&D 라이 사이클 연구 : 생명공학 나노분야를
심으로김혜선, 권나 , 정은경,
이정연, 최 규2011.11.30
28 웹사이트의 사용성 개선을 한 단계별 략 미환, 박민수, 이태석, 최 규 2011.12.05
29 국내 과학기술 연구자의 소셜 미디어 활용 황미환, 이혜진, 김혜선,
박민수, 최 규2011.12.08
30 이용 황 분석을 통한 학술정보 활용지표 개발 이혜진, 유수 , 김혜선, 이재윤 2012.01.31
31 FTA와 개정 작권법이 정보유통에 미치는 향 유수 , 이 희 2012.02.21
32 고품질 정보서비스 지원을 한 컴퓨 자원 인 라 구축정 임, 신용주, 한성근, 김재훈,
김정환, 최호남2012.03.30
33 모바일 앱(App) 개발을 한 특화 기술 분석 미환, 신수미, 김혜선 2012.08.10
34 한국과학기술정보연구원(KISTI) 원문제공서비스 황 분석 이선희, 김지 , 문 수, 신기정 2012.12.31
35 정보서비스 공공기 검색엔진 활용 만족도 조사이태석, 신수미, 유수 ,
정용일, 이은정2013.07.31
36 국내외 오 액세스 기술 서비스 동향 이은지, 미환, 김완종, 김혜선 2013.11.29
37 학술정보의 공개 공유를 한 법 쟁 유수 , 김완종, 김혜선, 최진원 2013.12.06
38 정보 공유를 한 국내외 OpenAPI 서비스 동향 미환, 신수미, 김혜선 2013.12.10
39 클라우드 기반 정보서비스 동향 사례 신수미, 미환, 김혜선 2013.12.13