40

KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼
Page 2: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼
Page 3: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

3 KISTI 지식리포트 제40호

❚ 목 차 ❚

1. 서론 ········································································································1

1) 시맨틱 웹과 링크드 데이터 ···························································1

2) 링크드 데이터의 원칙 ····································································2

2. 도서 링크드 데이터 ···········································································3

1) 도서 링크드 데이터의 특징 ·························································3

2) 도서 링크드 데이터 활동 ·····························································4

3. 도서 링크드 데이터 사례 ··································································8

1) 국 국립도서 ··············································································8

2) 독일 국립도서 ·············································································10

3) 랑스 국립도서 ·········································································11

4) OCLC(Online Computer Library Center) ····································13

5) LC Bibliographic Framework ·······················································17

4. 도서 링크드 데이터 구축의 필요성 ················································20

1) 데이터 심의 웹 생태계 ······························································20

2) 링크드 데이터의 실용성 ································································22

3) 링크드 데이터를 통한 근성 향상 ··············································26

5. 결론 제언 ·······················································································29

참고문헌 ···································································································31

KISTI 지식리포트 제40호

Page 4: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

❚ 표 목 차 ❚

<표 1> 링크드 데이터의 혜택 ································································6

<표 2> 통 도서 데이터의 문제 ·····················································7

<표 3> LLD 실 을 한 권고사항 ·························································7

<표 4> OCLC 링크드 데이터 자원 ························································14

<표 5> 도메인별 링크드 데이터 황 ····················································21

도서관 분야의 링크드 데이터 구축 동향

Page 5: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

❚ 그 림 목 차 ❚

<그림 1> 국 국립도서 단행본 링크드 데이터 모델 ·························9

<그림 2> 국 국립도서 연속간행물 링크드 데이터 모델 ·················9

<그림 3> 랑스 국립도서 RDF 데이터 모델 ···································13

<그림 4> WorldCat과 Schema.org를 활용한 WorldCat.org 서비스 효과 ·····15

<그림 5> WorldCat.org 서지정보 검색결과 ··········································15

<그림 6> OCLC 데이터셋 스키마 ··························································16

<그림 7> BIBFRAME Work-Instance 심 링크드 데이터 모델 ··········18

<그림 8> BIBFRAME Work-Instance-Annotation 링크드 데이터 모델 ··· 19

<그림 9> BIBFRAME의 텍스트, 비텍스트형 자원에 한 개념 모형 ····· 19

<그림 10> 링크드 데이터 황(2011년 9월 19일 재) ························20

<그림 11> LOV Aggregator 화면 ··························································23

<그림 12> LOV Suggest 화면 ································································24

<그림 13> LOV Search 화면 ··································································24

<그림 14> Clean Energy Linked Open Data Cloud ····························25

<그림 15> OECD Odata API 제 - 메타데이터 조회 ························27

<그림 16> 링크드 데이터 기반 BBC Music The Beatles 서비스 ·········28

<그림 17> BBC News Juicer 서비스 ·····················································28

KISTI 지식리포트 제40호

Page 6: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼
Page 7: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

1 KISTI 지식리포트 제40호

1. 서론

1) 시맨틱 웹과 링크드 데이터

□ Web 2.0 이 후로 웹을 랫폼으로 거의 모든 정보활동이 일어남.

- 정보는 웹에서 탄생하고, 풍부해지고, 재창조되고, 공유되고, 확산되고,

소멸됨(박진호, 2013a).

- 사람들은 매일 웹에서 수많은 데이터를 활용하지만 이 데이터를 웹의

일부분으로 보기는 힘듦. 재의 데이터들은 애 리 이션에 의해서 통

제되는 것으로 각각의 애 리 이션이 이 데이터를 스스로 유지하고 있

음(W3Ca, n.d.).

□ 본래 웹은 사람뿐만 아니라 기계간에도 소통이 가능한 정보공간으로 설계

되었으나 재 웹은 잘 정의된 데이터베이스로부터 정보를 추출함에도 불

구하고 웹 로 등 기계 보다는 사람에게만 유용한 구조를 갖고 있음.

- 시맨틱 웹(Semantic Web)은 기계 처리가 가능한 형태로 정보를 표 하

기 한 언어를 개발하는 근법임(Tim Berners-Lee, 1998).

- 시맨틱 웹은 웹문서의 교환에 집 되어 다양한 출처(source)에서 가져온

데이터를 통합, 조합할 수 있는 공통의 형식을 만드는 것에 한 것이며,

한 데이터가 실세계의 개체를 어떻게 표 할 것인지에 한 것을 기

록하기 한 언어임(W3Ca, n.d.).

☐ 시맨틱 웹은 재의 문서 심의 웹(Web of Document)에 데이터가 심

이 되는 새로운 계층(Web of Data)을 만드는 것이고, 링크드 데이터

(Linked Data)는 시맨틱 웹을 구 하기 한 방법으로 역참조할 수 있는

(deRefernceable) URI(Uniform Resource Identifier)를 활용해서 웹상에 데

이터를 공개, 공유 연결하는 방법임.

- Berners-Lee(2007)는 재 웹의 단계는 연결의 웹(Web of Links)으로

일반 으로 네트워크라는 말 신 “웹”이라는 용어를 표 으로 사용하

고 있으며, 이를 문서의 웹(Web of Documents)으로 칭함.

- 궁극 으로 우리가 원하는 것은 모든 것(All Things)들이 웹에서 공유되

는 것으로 보다 직 으로 데이터( 통 인 데이터베이스 콘텐츠와 같은)

Page 8: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

2도서관 분야의 링크드 데이터 구축 동향

를 웹에 확장해야 하고, 사람 혹은 분명한 실체를 갖고 있는 것과 추상

인 것, 장소 등과 연결 계를 만들어야 함.

- 거시 인 에서 이러한 연결을 데이터 웹(Web of data)라고 부를 수

있으며 이것이 링크드 데이터의 기 를 형성할 수 있음.

2) 링크드 데이터의 원칙

☐ Berners-Lee(2011)는 시맨틱 웹은 웹에 데이터를 올리는 것만을 의미하지

는 않으며, 링크를 만듦으로써 사람과 기계가 데이터 웹을 탐색할 수 있도

록 하는 것으로 정의함.

- 여기서 링크는 재 문서 웹의 하이퍼텍스트와 다르게 RDF(Resource

Description Framework)로 기술된 모든 것(things)들 사이의 연결을 의

미하며, URI는 객체나 개념을 식별하는데 활용됨.

☐ 링크드 데이터 발행을 한 원칙은 다음과 같음.

- 특정 개념(things)을 URI를 사용하여 명명함.

- HTTP를 활용해서 URI로 명명된 자원에 근할 수 있도록 함.

- URI로 정보를 찾았을 때 RDF(S), SPARQL과 같은 표 을 활용해서 유

용한 정보를 제공해야 함.

- 다른 URI를 포함하고 있어서 더 많은 것(개념, things)들을 탐색할

수 있어야 함.

Page 9: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

3 KISTI 지식리포트 제40호

2. 도서관 링크드 데이터

1) 도서관 링크드 데이터의 특징

☐ 도서 링크드 데이터는 통 으로 도서 이 리하고 있는 데이터를 변

환하는 것을 기본으로 하며 이 범주에 속하는 데이터는 크게 서지 데이터

와 거 데이터가 있음.

- 서지 데이터(bibliographic data) : 서명, 자, 날짜 등

- 거 데이터(authority data) : 분류, 주제명, 자명, 시소러스, 텍소노미 등

☐ 재 기존의 도서 에서 리하는 데이터를 링크드 데이터로 변환하여 발

행하는 사례와 데이터 범주는 다음과 같음.

- 국국립도서 (서지, http://bnb.data.bl.uk/)

- 스웨덴 종합목록(서지/ 거, http://data.libris.kb.se/)

- 독일국립도서 (서지/ 거)

- 네이처(서지, http://data.- nature.com/)

- VIAF( 거, http://viaf.org/viaf/data/)

- 미국의회도서 ( 거, http://id.loc.gov/)

- Lobid(서지/단체/조직, http://lobid.org/)

- 유로피아나( 거, http://data.europeana.eu/)

☐ 보통 도서 에서 거데이터는 주제명, 자명(개인, 단체명)을 칭하지만 실

제로 국립도서 의 경우 별도로 리하고 있는 다양한 통제 어휘들이 존재

하며 이의 링크드 데이터 변환과 발행도 요함.

- 국립 앙도서 의 경우 도서 부호, 정부기 부호, 국가 부호, 발행국

부호, 한국 학 부호, 외국지역구분 부호, 한국지역구분 부호, 언어구분

부호 등 다양한 통제어휘집이 존재함.

- 이러한 부호표는 외부 공개 시 다양한 분야에서 활용이 가능한 데이터임.

☐ Voß(2012)은 도서 이 가지고 있는 데이터에 한 시각 확 가 필요함을

언 함.

- 비서지형 데이터 열람시간, 근정보 등의 부가 인 정보도 요함.

Page 10: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

4도서관 분야의 링크드 데이터 구축 동향

- 특히 고객정보(Patron Information)와 련된 데이터는 좀 더 주의 깊게

살펴볼 필요가 있음.

∙개인 데이터 : 이름, 이메일 주소 등

∙계정 데이터 : 계정상태, 유형, 기한 등 도서 서비스 련 데이터

∙ 출, 약 데이터

- 도서 이용자는 특정 작물(FRBR1)의 Work)이나 개별 자료(FRBR의

Item)에 심이 있을 것이라는 제 하에 고객정보와 문헌정보를 연결시

켜 다른 부가 서비스를 창출할 수 있음.

∙Voß은 PAIA(Patron Account Information API)2)와 온톨로지를 구성

하여 공개하고 있음.

2) 도서관 링크드 데이터 활동

☐ 도서 링크드 데이터(Library Linked Data, 이하 LLD) 련 활동은 기존

도서 데이터를 링크드 데이터 원칙에 맞추어 발행하는 것과 근본 으로

도서 서지 데이터를 다른 에서 바라보고 변화시키려는 2가지로 구분

할 수 있음.

- 자의 경우는 통 으로 서지목록 작성, 표 화와 련된 역할을 담당

하는 국립도서 등의 서지, 통제어휘 리기 과 국제 인 서지목록 공

유 임워크인 OCLC가 표 임.

※ OCLC는 서지정보에 한 링크드 데이터 로젝트를 해 Schema.org를 활

용하고 있음. 이는 웹 환경에서 검색엔진(서비스)들이 보다 잘 서지 정보를 검

색하고 결과를 이용자에게 보여주기 한 노력의 일환으로 링크드 데이터 원

칙에 맞춘 로젝트로 보기는 어려워 별도로 기술함.

- 후자의 경우는 미국 의회도서 을 심으로 연구가 진행 인

Bibliographic Framework가 표 임.

☐ W3C Library Linked Data Incubator Group은 2010년 5월에서 8월까지 활

동한 그룹으로 웹 환경에서 도서 데이터가 로벌 상호운용성 증진을

한 역할을 하기 한 연구를 진행하고 있음.

1) FRBR(Functional Requirements for Bibliographic Records)은 서지레코드의 기능상의 요건을 의미함.

2) http://gbv.github.io/paia/paia.html

Page 11: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

5 KISTI 지식리포트 제40호

☐ LLD와 련된 실제 인 지침과 방향을 제시하고자 W3C Library Linked

Data Incubator Group은 2011년 10월 25일에 LLD 최종보고서3)를 발행하

음.

- 이 최종보고서에서 도서 (Library)은 도서 , 박물 , 기록 등 모든

문화유산 기 을 포함하는 용어임.

- 최종보고서에서는 링크드 데이터가 수 있는 혜택, 링크드 데이터 발

행을 해 재 도서 이 가지고 있는 문제와 향후 LLD의 발 을 해

련된 자(기구 포함)들에 한 권고사항을 기술하고 있으며 실제 지침

으로 활용할 수 있도록 구성됨(박진호, 2013b).

- LLD 최종보고서는 도서 데이터가 가지고 있는 문제는 웹의 다른 자

원과 통합이 어려움, 도서 에서만 용 가능한 표 의 활용, 부분의

정보가 보여주기 한 텍스트 심인 , 시맨틱 웹 커뮤니티와 유사 개

념에 한 상이한 용어의 사용, 소수의 기술 공 자에 따른 의존 인 발

이라고 지 하고 있음.

- 마지막으로 최종보고서에서는 도서 데이터의 개방은 데이터 웹을 사

용함으로써 도서 의 데이터 포용력을 높이는 활동이며, 도서 데이터

는 웹에 존재하는 다른 자원과 통합이 되어야 도서 서비스에 한 인

식이 높아질 수 있을 지 하며 <표 3>과 같은 권고사항을 제시함.

☐ LLD 최종보고서에서 사용하고 있는 LLD와 련된 자원의 표 은 다음과

같음.

- 데이터셋(Datasets) : 국 국가서지, 헝가리 국립도서 목록, Open Library,

CrossRef, Europeana 등

- 값 어휘집(Value Vocabularies) : 미국국회주제명표목, AGROVOC4), VIAF

(Virtual International Authority File), DDC(Dewey Decimal Classification

System), GeoNames 등

- 메타데이터 요소셋(Metadata Element Sets) : DCMI(Dublin Core

Metadata Initiative) 메타데이터 용어, RDA의 구성요소, SKOS(Simple

Knowledge Organization System), FOAF(Friend of A Friend) 어휘 등

3) http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/

4) AGROVOC은 Agriculture, Forestry, Fisheries, Food security(농업, 산림, 어업, 식량 보존)의

약자로 농업, 산림, 어업, 식량 보존과 그에 연결된 분야 (예를 들면 지속 가능한 발전과 영양) 안

에서 모든 주제와 관련된 다중 언어로 서비스되는 사전임.

Page 12: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

6도서관 분야의 링크드 데이터 구축 동향

☐ 개방형 링크드 데이터는 공유, 확장, 재사용 측면에서 기존의 데이터 근

방식보다 많은 장 을 가지고 있으며, 국립도서 과 같이 신뢰할 수 있는 정

보원으로부터 생산된 데이터들의 연결이 데이터의 가치를 높여 수 있음.

- 특히, 도서 의 자명, 주제명 거데이터는 연결 데이터 사이에 공유

되는 핵심 개체를 명확하게 식별해 주기 때문에 데이터 복을 여

수 있음.

활용 주체 활용 혜택

정보 근자

(연구자, 학생, 이용자)

∙ 도서 과 외부 기 과의 정보자원 연결로 보다 풍부한 탐색이

가능함.

∙ 도서 의 정보를 통해 웹 상의 다른 정보로 연결될 수 있음.

∙ 웹에 구조화된 데이터가 추가되기 때문에 검색엔진 최 화(SEO)

를 통해 향상된 검색 결과 제공이 가능함.

∙ 다양한 분야의 지식베이스에 연결이 가능하여 학제 간 연구에

도움을 수 있음.

정보 리 조직

(도서 등)

∙ 상향식 데이터 발행으로 자 의 정보자산을 기술하는 일의 가치

를 높일 수 있음.

∙ 산 문제로 상세한 수 의 데이터 기술이 부족한 문제를 극복

할 수 있음.

∙ 도서 이 리시스템 등 주류 솔루션을 벗어나 데이터 연결이

가능한 다수의 시스템 선택이 가능하고, 표 연결데이터 활용으

로 보다 다양한 개발자 그룹과 소통이 가능함.

∙ 클라우드 기반의 데이터 활용 근을 한 출발 이 될 수 있으

며, 독립형 시스템에 비해 비용 비 효과가 큼.

∙ 규모가 작은 기 , 개인들이 은 비용으로 가시 인 데이터 연

결 효과를 볼 수 있음. 즉 공개된 데이터를 활용하여 군가 가

치 있는 성과를 낼 수 있는 기회를 제공해 .

정보활동 주체

(사서, 기록담당자 등)

∙ 로벌 공유 데이터를 통해 편목에서의 복 노력을 이고, 자

원 기술의 효율성, 재활용성을 증가시킴.

∙ 타 지식분야의 잘 정리된 기술내용을 활용할 수 있어 사서는 본

인의 문분야에 한 기술노력에 집 할 수 있음.

∙ 구문, 형식이 아니라 데이터의 의미를 기술하는 것으로 향후 지

속가능한 체계로 데이터 리가 가능함.

련 개발자(사)

∙ 도서 에 특화된 데이터에 집 할 필요 없이, HTTP와 같은 웹

로토콜을 활용함으로써 일 된 방식의 데이터 검색과 결합이

가능함.

∙ 링크드 데이터 방식으로 도서 분야를 벗어나 새로운 시장에

활용할 수 있으며, RDF, HTTP를 활용함으로써 특정 소 트웨

어 활용의 부담에서 벗어날 수 있음.

<표 1> 링크드 데이터의 혜택

Page 13: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

7 KISTI 지식리포트 제40호

도서관 데이터의 문제점

웹 자원과 통합의 어려움

∙ 도서 데이터는 웹 인터페이스에서 근 가능하지만 날짜, 지리

정보, 사람, 조직 등 수많은 데이터 들과의 연결에는 어려움

이 있음.

도서 분야에서만

활용되는 표

∙ MARC, Z39.50 등은 도서 분야에서만 통용되며 주로 이러한

표 들은 국제도서 회 등의 기 에 의해서 추진됨.

도서 데이터는 자연어

(natural-language)

텍스트로 표 됨.

∙ 도서 데이터는 텍스트 형태로 표 됨.

∙ ISBN과 같은 식별자는 연결을 해 사용이 가능하지만 텍스트

값을 정규화 하는 과정이 필요함.

∙ 통제어휘를 활용하고 있으나 이는 부분 이며, 웹에 연결될 수

있는 URI 표 이 부족함.

도서 계와 시맨틱 웹

커뮤니티 간 상이한

용어 표

∙ 서로 상이한 용어를 사용하여 통합의 과정을 어렵게 할 수 있음.

∙ 도서 에서는 “statements”, 시맨틱 웹에서는 “headings”, “authority

control” 등의 용어를 이해하기 어려움.

소수의 기술 공 자에

의존

∙ 도서 자동화, 이용자 서비스 등의 시스템과 소 트웨어는 소수

의 공 자 심이며, 링크드 데이터 도입의 경우 도서 의 자체

계획보다 업체의 기술개발 계획에 의존해야 하는 경우가 발생함.

<표 2> 전통적 도서관 데이터의 문제

주체 권고내용

도서

리그룹(leadership)

∙ 조기에 링크드 데이터로 발행할 수 있는 데이터셋 확인

∙ 개방형 데이터에 한 토론 장려

표 화기구 참여자

(standards bodies and

participants)

∙ 시맨틱 웹 표 화 부분에 도서 의 참여 확

∙ 링크드 데이터에 부합하는 도서 데이터 표 개발

∙ LLD에 합한 최고의 설계(best practice design) 개발 보

데이터, 시스템 설계자

(data and systems

designers)

∙ 링크드 데이터에 기반한 이용자 서비스 개발과 테스트

∙ 도서 데이터셋에 포함되는 개별자료(items)에 한 URI 생성

∙ 링크드 데이터 어휘집과 그 URI를 리하기 한 정책 개발

∙ 기존 링크드 데이터 어휘집과 매핑 혹은 재활용하여 도서 데이

터 표

사서와 기록

(librarians and archivists)

∙ 링크드 데이터 요소 셋(element sets)과 값 어휘집(value vocabularies)

보존

∙ 장기보존과 큐 이션에 있어서 도서 의 경험을 LD 데이터셋에

<표 3> LLD 실현을 위한 권고사항

Page 14: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

8도서관 분야의 링크드 데이터 구축 동향

3. 도서관 링크드 데이터 사례

☐ 본 장에서는 LLD의 표 인 3가지 유형의 사례를 살펴보고자 함.

- 자 이 소장하고 있는 데이터를 링크드 데이터 원칙에 맞추어 발행하고

있는 표 인 사례로 국 국립도서 , 독일 국립도서 , 랑스 국립

도서 의 사례를 살펴 .

- 데이터 웹에서 명확한 근 과 기 을 제시해 수 있는 값 어휘집

을 제공하고 있는 표 사례인 OCLC를 살펴 .

- 링크드 데이터를 넘어 서지 정보자원을 데이터 웹에 어떻게 표 하는가에

한 개념 인 근을 시도하고 있는 LC Bibliographic Framework 사례

를 살펴 .

☐ 본 장에서 소개하는 링크드 데이터 서비스 사례는 기존에 도서 에서 수행

하지 않았던 새로운 서비스가 아닌 디지털서비스의 일종임.

1) 영국 국립도서관

☐ 자 서지 정보를 링크드 오 데이터 형태로 개방하고 있으며, 재 단행

형태의 도서자료와 연속간행물에 한 데이터 서비스를 수행하고 있음.

- Free Data Services라는 명칭으로 서비스 임.

- 근 URL : http://www.bl.uk/bibliographic/datafree.html

- 스키마 정보 URL : http://www.bl.uk/schemas/

- 체 일 다운로드(Bulk downloads, RDF/XML과 N-Triples) URL :

http://www.bl.uk/bibliographic/download.html

Page 15: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

9 KISTI 지식리포트 제40호

<그림 1> 영국 국립도서관 단행본 링크드 데이터 모델

<그림 2> 영국 국립도서관 연속간행물 링크드 데이터 모델

Page 16: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

10도서관 분야의 링크드 데이터 구축 동향

☐ 재 약 280만 건의 원천 코드를 상으로 총 93,583,853건의 트리 을 제

공하고 있으며, 기존에는 데이터 활용을 한 세 가지의 서비스를 제공

하 으나 재는 데이터서비스를 한 단일 웹사이트(http://bnb.data.bl.uk/)

로 통합되었음.

☐ 국 국립도서 에서 링크드 데이터 기술을 해 활용하고 있는 어휘집은

다음과 같음.

- Bibliographic Ontology, Bio, British Library Terms, Dublin Core,

Event Ontology, FOAF, ISBD, Org, OWL, SKOS, RDF Schema,

WGS84 Geo Positioning, RDA

☐ 국 국립도서 링크드 데이터 자원과 연결된 외부 링크드 데이터셋은 다

음과 같음.

- VIAF, LCSH, Lexvo, GeoNames(출 국 표 ), MARC(국가/언어코드),

Dewey.info, RDF Book Mashup

☐ 국 국립도서 사례에서의 시사 은 다음과 같음.

- 재 국 국립도서 에서는 데이터 서비스를 한 별도의 사이트를 운

하고 있는데, 링크드 데이터는 이러한 데이터 서비스의 일부로 자유롭

게 활용이 가능한 데이터 서비스로 분류되어 서비스 되고 있음.

- 국 국립도서 의 데이터서비스 사이트(http://bnb.data.bl.uk/)에서 메타

데이터 서비스 메뉴의 Free Data 메뉴를 통해 이용이 가능함.

- 단행본, 연속간행물 등 통 인 도서 의 리 상 객체를 하나의 도

메인으로 보고 모델링하 음.

2) 독일 국립도서관

☐ 독일 국립도서 의 링크드 데이터 로젝트는 2010년 거데이터의 변환을

시작으로 2012년 서지데이터에 한 링크드 데이터화로 이어짐.

- 근 URL : http://www.dnb.de/EN/lds

- 체 일 다운로드(Dumps) URL :

http://datendienst.dnb.de/cgi-bin/mabit.pl?userID=opendata&pass=opend

ata&cmd=login

Page 17: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

11 KISTI 지식리포트 제40호

☐ 거데이터(GND, Gemeinsame Normdatei)는 기존에 존재하던 PND, 주제

명(SWD), 종합 거(GKD), 독일음악 기록물 표목 거를 통합한 형태로 독

일어 정보자원에 한 근성을 향상시켜 독일어권 국가의 다양한 기 에

서 활용할 수 있도록 함.

☐ 서지데이터에 한 링크드 데이터화는 악보, 핵심 장서, 연속간행물 목록

정보, 일반 , 신문, 연속간행물 모두를 포함하고 있으며, 링크드 데이터

로 변환하기 한 모델링 작업과 변환에 합한 데이터 선정을 해 독일

어권 국가 도서 특별 원회를 운 하고 있음.

☐ 독일 국립도서 에서 링크드 데이터 기술을 해 활용하고 있는 어휘집은

다음과 같음.

- Dublin Core terms, Dublin Core elements, Bibliographic Ontology,

RDA, ISBD, RDF Schema, Upper Mapping and Binding Exchange

Layer (Umbel), FOAF, Schema.org

☐ 독일 국립도서 의 링크드 데이터 자원과 연결된 외부 링크드 데이터셋은

다음과 같음.

- MARC-Code, Dewey.info, 내부 서지정보 링크(http://d-nb.info)

☐ 독일 국립도서 사례에서의 시사 은 다음과 같음.

- 독일 국립도서 은 재 링크드 데이터 변환 서비스 외에 미국 의회도

서 심의 LC Bibliographic Framework 로젝트에 참여하고 있으며,

향후 새로운 데이터 모델링과 어휘집을 활용한 링크드 데이터 서비스를

기 할 수 있음.

- 재 데이터에 한 발행서비스와 더불어 미래지향 인 서지 목록에

한 연구를 동시에 진행하고 있음.

3) 프랑스 국립도서관

☐ 랑스 국립도서 은 소장 주요 목록은 물론 디지털도서 서비스인 갈리

카(Gallica)를 포함한 링크드 데이터 서비스를 제공하고 있음.

Page 18: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

12도서관 분야의 링크드 데이터 구축 동향

- 근 URL : http://data.bnf.fr/

- 체 일 다운로드(Dumps) URL :

http://echanges.bnf.fr/PIVOT/databnf_all_rdf_xml_2013_09_25.tar.gz?use

r=databnf&password=databnf

☐ 랑스 국립도서 에서 링크드 데이터 기술을 해 활용하고 있는 어휘집

은 다음과 같음.

- RDF, RDF Schema, SKOS, DC, FOAF, RDA Group2, RDA Relationships,

RDA Group1, OWL, ORE

☐ 랑스 국립도서 의 링크드 데이터 자원과 연결된 외부 링크드 데이터셋

은 다음과 같음.

- LCSH(id.loc.gov), Dewey.info, DCMI type, DBpedia, VIAF, IdRef, Wikipedia

- 랑스 국립도서 링크드 데이터는 FRBR 모형을 기본 모델링에 반

하고 있음.

☐ 랑스 국립도서 사례에서의 시사 은 다음과 같음.

- 데이터 모델링에 FRBR 개념을 반 하고 있어 보다 서비스 지향 인

근 방식을 취하고 있음.

- 향후 LC Bibliographic Framework 근에 있어 타 도서 보다 유연하

게 처 가능한 구조를 가지고 있음.

Page 19: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

13 KISTI 지식리포트 제40호

<그림 3> 프랑스 국립도서관 RDF 데이터 모델

4) OCLC(Online Computer Library Center)

☐ OCLC는 1967년 설립되어 세계 171개국 지역의 72,000개 도서 과

연계되어 목록, 참고자원, 자자원 통합검색과 도서 자원 공유 보존,

웹 서비스 활동을 수행하는 비 리 기구임.

☐ OCLC가 링크드 데이터로 개발하여 운 하고 있는 데이터 자원으로는

DDC, FAST(Faceted Application of Subject Terminology), VIAF가 있음.

Page 20: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

14도서관 분야의 링크드 데이터 구축 동향

링크드 데이터 유형 링크드 데이터 특징

VIAF

(Virtual International

Authority File)

∙ URL : http://viaf.org

∙ 제공형태 : HTML, RDF/XML

DDC

(Dewey Decimal

Classification)

∙ URL : http://dewey.info

∙ 제공형태 : HTML/RDFa, RDF/XML, Turtle, JSON-SPARQL

FAST

(Facet Application of

Subject)

∙ URL : id.worldcat.org/fast

∙ 제공형태 : HTML, RDF/XML - Download

<표 4> OCLC 링크드 데이터 자원

☐ OCLC는 2012년 6월부터 WorldCat.org 코드에 Schema.org 태그를 추가

하여 도서 자원에 한 검색엔진의 근성을 향상시킴.

- 동년 8월에는 WorldCat에서 활용 가능한 약 8천만건의 서지 링크드 데

이터 트리 을 발행하 으며, 체 데이터셋을 다운로드5) 할 수 있도록

하고 있음.

☐ WorldCat 링크드 데이터 서비스

- WorldCat은 Schema.org의 용어집을 활용하여 서지 정보에 한 구조화

된 데이터를 제공함.

- 이는 웹 검색엔진(서비스)에서 WorldCat 서지 정보에 한 근성을 강

화하는 효과를 갖는데, 이는 서지 정보 기술을 한 OCLC의 1세 링

크드 데이터 모델임.

- OCLC는 사서의 에서 Schema.org의 단 을 해결하기 해 “도서

”, “소장”이라는 객체를 설명하기 한 어휘를 확장하고, 콘텐츠와 캐

리어(carrier)를 분리하는 시도를 함.

- W3C Community and Business Groups 내에 “Schema Bib Extend

Community Group”은 Schema.org를 확장하여 서지 정보를 구조화하고

공유하기 한 보다 향상된 방법을 찾고자 하는 시도임6).

- 근본 으로 OCLC의 데이터셋은 FRBR 개념에 기 하고 있으며, 이는

미국 의회도서 의 LC Bibliographic Framework 로젝트와 유사한 개

념 근을 가짐.

5) http://purl.oclc.org/dataset/WorldCat/datadumps/WorldCatMostHighlyHeld-2012-05-15.nt.gz

6) http://www.w3.org/community/schemabibex/

Page 21: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

15 KISTI 지식리포트 제40호

<그림 4> WorldCat과 Schema.org를 활용한 WorldCat.org 서비스 효과

<그림 5> WorldCat.org 서지정보 검색결과

Page 22: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

16도서관 분야의 링크드 데이터 구축 동향

<그림 6> OCLC 데이터셋 스키마

☐ OCLC 사례에서의 시사 은 다음과 같음.

- 값 어휘집(Value Vocabularies)에 속하는 VIAF, DDC, FAST 데이터를

제공하고 있는데, 이를 통해 다양한 데이터셋들이 상호 연결될 수 있는

연결 역할이 가능하며 기존의 도서 데이터셋( 자, 주제 등)들의 활

용성을 극 화 시킬 수 있음.

- Schema.org 어휘집을 활용하여 웹에서 OCLC 데이터에 한 검색 최

화를 도모하고 있으며, 이 은 일반 인 도서 에서의 링크드 데이터 발

행이 자 데이터를 RDF 일로 출 하고 공유하는 형식인 것을 감안

할 때 차별화 된 방식임.

- 단순히 링크드 데이터로 변환하여 소장 정보를 발행하는 것 외에 분명

한 목 을 가지고 링크드 데이터를 발행할 수 있는 용어집과 발행 방법

(RDFa)을 선택한 에서 시사 이 있음.

Page 23: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

17 KISTI 지식리포트 제40호

5) LC Bibliographic Framework

☐ 미국 의회도서 은 2011년 5월에 서지 임워크 이니셔티 를 발표하고

장기 인 에서 “네트워크”라는 개념을 심에 두고, 서지 정보들이 끊

임없이 상호 연결되어 있는 새로운 서지 환경을 구축하고자 함.

☐ LC Bibliographic Framework(이하 BIBFRAME)은 어떤 형태의 내용 표

이나 콘텐츠 표 ( , RDA)도 수용할 수 있도록 구성되어야 하지만 역시

도서 간에 데이터 교환이 가능한 모델을 지향함.

☐ BIBFRAME( 재 안)의 목 은 미래의 정보자원과 MARC21로 인코딩 된

통 인 서지데이터를 모델링 할 수 있는 패턴을 제공하는 것임.

- 이 패턴은 웹을 기본 인 틀로 활용하여 기존 서지정보의 통합을 가능

하게 하고, 링크드 데이터 등을 통해 기존 데이터에 한 정제 재개

발과 같은 안 인 근이 가능하도록 함.

- MARC21은 도서 간의 데이터 교환을 해 개발된 가장 최근의 데이

터 포맷임.

- MARC21 형식을 링크드 데이터 모델로 반 함으로써 데이터의 유용성

이 높아질 수 있고, 데이터 활용 범 가 도서 의 역에서 문화유산 기

으로 확장될 수 있음.

☐ BIBFRAME을 연구 활동, 기술개발 등의 으로 보는 것도 요하지만

기존의 서지데이터가 갖는 역사 맥락을 수용하여 새로운 환경(웹)에서의

정보 데이터 생태계를 구축하기 한 노력으로 이해해야 함.

☐ BIBFRAME은 다음과 같은 을 고려하여 설계되었음.

- 미래의 목록 정보, 새로운 이용자 시나리오와 다양한 정보출처 등에

응하기 한 유연성 확보

- 분산된 정보들을 연결하고 표 하기 한 아키텍처 모델로서의 웹

- 도서 외부의 사회 , 기술 변화에 한 도입

- 도서 커뮤니티 내부의 사회 , 기술 확장

- 링크드 데이터로 서지 정보를 표 하기 한 이 의 시도

- 기계 인 작업을 한 기술 도입과 주제 문가로서 사서의 역량 수용

Page 24: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

18도서관 분야의 링크드 데이터 구축 동향

- 도서 , 출 계, 기록 , 박물 커뮤니티에서의 서지 정보를 모델링하기

한 이 의 노력

- MARC의 다음과 같은 특징을 고려하여 설계함.

∙ 작물의 지식 본질과 련된 데이터의 생성, 리, 공유, 보존

∙ 작물의 실제 인스턴스와 련된 데이터의 생성, 리, 공유, 보존

∙제어번호, 코드 제어코드와 같은 메타데이터의 생성, 리, 공유, 보존

☐ BIBFRAME의 핵심 클래스는 다음과 같음.

- Creative Work : 목록화 된 자료의 개념 본질을 반 하고 있는 자원

- Instance : 작물을 구 한 개별 자료 등을 반 하고 있는 자원

- Authority : 사람, 장소, 주제, 조직 등을 포함한 거 자원으로 작물이

나 인스턴스에 반 되어 계를 정의하고 있는 개념 자원

- Annotation : BIBFRAME의 다른 자원을 표 할 수 있는 추가 인 자원

으로 도서 의 소장정보나 표제 그림, 논평 등의 자원

<그림 7> BIBFRAME Work-Instance 중심 링크드 데이터 모델

Page 25: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

19 KISTI 지식리포트 제40호

<그림 8> BIBFRAME Work-Instance-Annotation 링크드 데이터 모델

☐ BIBFRAME의 구성은 FRBR의 작(work)과 구 (manifestation) 계를

심으로 FRBR2, 3 모델을 목한 형태를 가짐.

<그림 9> BIBFRAME의 텍스트, 비텍스트형 자원에 대한 개념 모형

Page 26: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

20도서관 분야의 링크드 데이터 구축 동향

4. 도서관 링크드 데이터 구축의 필요성

1) 데이터 중심의 웹 생태계

☐ “연결”의 에서 재 웹의 심은 “Web of Documents”, 즉 HTML 구

문(syntax)이 심이 되는 문서 간 연결로 이루어진 생태계이며, 링크드 데

이터는 “Web of data” 즉 XML, RDF/OWL을 활용하여 의미(semantic)가

심이 될 수 있도록 웹에 표 된 다양한 객체/개념을 연결하여 데이터 간

의 연결이 심이 되는 새로운 생태계임.

- 링크드 데이터는 결국 웹에 새로운 데이터 심 계층을 형성하게 되고

웹은 그 자체로 로벌 데이터베이스 역할을 수행함.

☐ <그림 10>은 2011년 9월 19일 재 링크드 데이터 황을 나타냄.

- 데이터셋 황과 데이터셋 간의 연결 계를 보여 .

- 각 노드는 링크드 데이터 형태로 발행된 각각의 데이터셋을 나타냄.

- 연결선(화살표)은 RDF 링크로 두 개의 연결된 데이터셋에 포함된 개별

항목(items)들의 계를 표 함.

<그림 10> 링크드 데이터 현황(2011년 9월 19일 현재)

Page 27: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

21 KISTI 지식리포트 제40호

☐ <표 5>는 2011년 9월 19일 재 링크드 데이터 클라우드에 포함된 데이터

들의 도메인별 황을 보여 .

- 가장 많은 데이터셋을 포함하고 있는 도메인은 출 이며, 정부 도메인에

속하는 데이터가 두 번째 비 을 차지함.

- 반면, 정부 도메인은 체 트리 의 양 규모가 42.09%로 인 수치

를 형성하고 있음.

- RDF 링크 수는 특정 도메인내의 데이터 소스에서 다른 데이터 소스로

설정되어 나가는 링크(out-links)를 의미함.

- 가장 많은 링크(out-links) 비 은 생명공학이지만 출 도메인의 데이

터 역시 27.76%로 두 번째 비 을 차지함.

도메인데이터셋

개수 트리플수 비율(%) 외부링크수 비율(%)

Media 25 1,841,852,061 5.82 50,440,705 10.01

Geographic 31 6,145,532,484 19.43 35,812,328 7.11

Government 49 13,315,009,400 42.09 19,343,519 3.84

Publications 87 2,950,720,693 9.33 139,925,218 27.76

Cross-domain 41 4,184,635,715 13.23 63,183,065 12.54

Life sciences 41 3,036,336,004 9.60 191,844,090 38.06

User-generated

content20 134,127,413 0.42 3,449,143 0.68

합계 295 31,634,213,770 100 503,998,829 100

<표 5> 도메인별 링크드 데이터 현황

출처 : http://lod-cloud.net/state/

☐ 데이터를 심으로 하는 새로운 웹 생태계 구성 에서 지식정보 리기

은 자 이 소유, 리하고 있는 데이터를 링크드 데이터 원칙에 맞추어

발행하는 과정을 고려해야 함.

- 리하고 있는 데이터 형태(구조 , 비구조 )와 특징( 작권 유무 등)

악이 필요함.

- 링크드 데이터 형태로 발행했을 때 가장 효과 인 데이터가 무엇인지

악해야 함.

Page 28: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

22도서관 분야의 링크드 데이터 구축 동향

☐ 동일 도메인 혹은 타 도메인과의 인터 링킹(inter-linking)으로 자 의 데이

터에 보다 풍부한 근 을 수 있다는 필요성 외에 새로운 데이터 웹

구축에 기여하다는 측면에서의 시도에 을 두는 것이 필요함.

☐ 데이터를 심으로 하는 새로운 웹 생태계 구성은 링크드 데이터 원칙에

맞추어 재 리하고 있는 데이터를 웹에 공개하는 에서의 근 으

로 앞서 기술된 국립도서 들의 사례가 표 임.

2) 링크드 데이터의 실용성

☐ 링크드 데이터에 한 심과 링크드 데이터 원칙에 하여 생산된 데이터

의 증가는 다른 문제 과 근 을 제시함.

- 링크드 데이터의 증가에 따라 객체와 객체(개념과 개념)를 이어주고

계를 보다 상세히 기술할 수 있도록 해주는 용어집의 선택 문제가 생김.

☐ 링크드 데이터를 기반으로 한 웹의 성장으로 수많은 RDFS/OWL 기반의

용어집들이 존재하며, 용어집은 SKOS, DC, FRBR과 같은 표 뿐만 아니

라 FOAF, Event Ontology와 같이 사실상의 표 으로 통용되고 있는 것들

도 있음.

- 재 수많은 용어집들이 생성되고, 상호 연결되어 웹상에 발행되면서 새

로운 용어집 생태계를 이루고 있음.

☐ 링크드 데이터 자체도 리가 필요한 하나의 데이터라는 의 변화가 필

요하며, 이는 표 으로 Linked Open Vocabularies(이하 LOV)와 같은

로젝트가 보여주는 다양한 서비스에서 확인이 가능함.

☐ LOV(http://lov.okfn.org)는 어휘 생태계에 쉽게 근할 수 있는 방법을 제

공하는데, OKF(Open Knowledge Foundation)의 지원으로 Datalift7) 로

젝트의 결과로 개발되었음.

7) 프랑스 국립 연구청(L'Agence nationale de la recherche)의 지원 하에 수행된 실험적 연구프로

젝트로 프로젝트의 목적은 관계형 DB, CSV, XML 등 다양한 구조적 형태의 원천 소스를 웹상에

상호 연결된 시맨틱 데이터로 변환할 수 있도록 하는 것임. 이용자는 이 프로젝트에서 개발된 툴

로 데이터를 출판하기 위한 온톨로지 선택 – 데이터를 적절한 형태의 RDF(선택한 온톨로지를 활

용해서 RDF 형태로) 변환 – 링크드 데이터로 출판 – 다른 데이터 소스와 인터링킹 등의 기능을

수행할 수 있음.

Page 29: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

23 KISTI 지식리포트 제40호

☐ LOV의 주 이용자 계층은 어휘 이용자와 리자 모두를 상으로 함.

- 어휘 이용자는 자신의 데이터를 가장 잘 기술할 수 있는 합한 어휘를

선택해야하고, 리자는 자신이 리하는 용어집에 한 가용성을 확인

하고 이용자 피드백을 통해서 장기 으로 안정 인 용어집 운용이 가능

하도록 할 수 있음.

- LOV는 어휘집 생태계에서 각 어휘들의 품질 평가와 검색을 한 랫폼

인 동시에 이 생태계를 장기 으로 지속가능하게 유지하기 한 활동임.

☐ LOV는 기본 으로 LOD 클라우드(http://linkeddata.org/)에 존재하는 RDFS

용어집이나 OWL 온톨로지를 포함하고 있으며, 다음의 조건을 충족하는 용

어집을 수집(LOV에 직 신청도 가능)함.

- RDFS, OWL과 시맨틱 웹 온톨로지 언어 하나로 표 되어야 함.

- 웹에서 자유롭게 활용 가능하도록 출 되어야 함.

- 네임 스페이스의 URI를 활용하면 내용 상(content negotiation)에 의한

검색이 가능해야 함.

- 다른 용어집의 일부 혹은 체로 통합과 재사용이 용이해야 함.

☐ LOV가 제공하는 기능은 다음과 같음.

- LOV Aggregator : 용어집과 용어에 한 Endpoint 제공, 각 용어집의

재 상태를 일 단 로 조회할 수 있고 다운로드가 가능함.

<그림 11> LOV Aggregator 화면

Page 30: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

24도서관 분야의 링크드 데이터 구축 동향

- LOV Suggest : LOV 목록에 포함시키기 한 새로운 용어집 등록 기능

을 제공함. 용어집에 한 유효성 검증 후에 등록이 가능함.

<그림 12> LOV Suggest 화면

- LOV Search : LOV 검색으로 요소명(속성, 클래스, 용어집 등)에 한

검색이 가능하며, 검색한 요소명에 한 도메인별, 유형별, 용어집별 필

터링을 지원함. 다음과 같은 평가 지표를 가짐.

∙ 질의어와 요소명(element labels) 련성

∙ 요도와 일치된 요소명

∙ LOV 데이터셋에서 요소의 발생 건수

∙ 요소를 참조하고 있는 LOV 데이터셋에서 용어집의 수

∙ LOC에서 요소의 발생 건수

<그림 13> LOV Search 화면

Page 31: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

25 KISTI 지식리포트 제40호

☐ 링크드 데이터 역시 리가 필요한 데이터라는 은 단순히 자 의 데이터

를 링크드 데이터로 서비스한다는 범 를 벗어나 링크드 데이터라는 개념

에 근하고자 하는 이들과 연구자 등에게 다른 형태의 서비스를 제공

해 수 있음.

- 이러한 근 을 갖는 정보 리기 은 해당 도메인에 특화된 링크드 데

이터 모델 제공과 더불어 링크드 데이터에 한 학문 , 실용 근을

가능하게 함.

☐ Blumauer(2013)는 링크드 데이터가 학문 인 역은 물론이고 일반 인 활

용을 한 근 으로의 역할을 수행하기 해서는 지 과 같은 형태의 일

반 인 지식이 아니라 보다 세부 도메인의 지식을 달할 수 있는 신뢰할

수 있는 링크드 데이터 클라우드가 필요함을 언 함.

- 표 인 로 독일 국립도서 링크드 데이터 클라우드와 클린 에 지

링크드 데이터 클라우드를 제시함.

<그림 14> Clean Energy Linked Open Data Cloud

Page 32: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

26도서관 분야의 링크드 데이터 구축 동향

- 기에 구축된 링크드 데이터 클라우드는 다시 한 번 재 검이 필요하

며, 첫 단계로 개방형 데이터인 것과 아닌 것을 보다 명확히 표시하고,

두 번째로 클라우드 내 데이터셋의 품질과 신뢰성에 책임을 지고 있는

자(기 )를 보다 명확히 할 필요가 있음.

- 한, 링크드 데이터 클라우드에서는 데이터가 부가 아니며, 그 뒤에

존재하는 사람과 조직이 요한데, Trusted Clean Energy Lod Cloud의

경우 연결된 데이터셋을 리하는 조직들은 공통의 데이터 인 라 기반

에서 효율 인 업 작업을 수행하고 있음.

☐ 하나의 데이터로써 링크드 데이터와 실용 활용 기반 구축은 단순히 소장

데이터에 한 링크드 데이터 개방 외에 링크드 데이터를 활용하고자 하는

자(조직)에게 효과 이고 효율 인 근 (LOV와 같은 링크드 데이터 분

석, 평가)을 제시해 필요가 있음. 링크드 데이터의 링크가 가장 괴력

을 발휘할 수 있는 것은 데이터 뒤에 연결되어 있는 조직 간의 연계 력

인 라임을 주지해야 함.

3) 링크드 데이터를 통한 접근성 향상

☐ 링크드 데이터는 웹이라는 랫폼에서 소통하기 한 방식 의 하나로,

도서 의 경우 MARC, OAI, OpenAPI 등 다양한 방식으로 데이터를 개방

하고 도서 간 혹은 타 기 과 데이터를 교환해 왔음.

- 그러나 이러한 소통 방식은 직 으로 웹을 랫폼으로 활용하지는 않

으며, 데이터 간의 소통을 한 표 (속성) 역시 MARC, MODS 등 도

서 도메인에서만 가능한 한계가 있음.

☐ 링크드 데이터 원칙을 수하여 웹에 구조화된 데이터를 발행하고 공유하

고 재사용할 수 있는 기회를 제공하는 것은 가장 근본 인 데이터 웹을 만

드는 방식이지만, 기존의 소통방식(OAI 등) 역시 유지해야 하며, 구조화된

데이터의 개방과 활용이라는 에서 OData(Open Data Protocol)와 같은

방식도 고려한 데이터 랫폼 구축에 을 둘 필요가 있음.

- OData(개방형 데이터 로토콜)는 인터넷을 통해 데이터를 송하는

로토콜로 웹상에서 손쉽게 데이터를 조회, 수정 등이 가능한 웹 로토

콜(http://www.odata.org)임.

Page 33: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

27 KISTI 지식리포트 제40호

☐ 구조화된 데이터의 발행과 근 향상은 웹상에 구조화된 데이터를 발행

하고 링크드 데이터 방식 이외의 다양한 웹을 기반으로 하는 소통방식에

근할 필요가 있음을 강조한 것으로, 뿐만 아니라 링크드 데이터는 발행뿐

만 아니라 실제로 서비스에 활용이 가능한 데이터임을 주지해야 함.

<그림 15> OECD Odata API 예제 - 메타데이터 조회

(http://stats.oecd.org/OECDStatWCF_OData/OData.svc/$metadata)

☐ 링크드 데이터에 한 근 방식 하나로 고려해야 하는 것 의 하나는

웹에서 특히, 검색엔진에서의 근성 향상 임.

- OCLC의 사례처럼 부분 이용자들의 근 경로인 Google 등 검색엔진

(서비스)에서의 근성 향상을 한 Shema.org 용어집 참조와 RDFa

용 등 고려 필요

☐ 링크드 데이터는 데이터의 발행 방식 의 하나인 동시에 활용이 가능한는

살아있는 데이터 셋임.

☐ BBC에서는 BBC Music, BBC Programmes와 같은 링크드 데이터를 활용

한 서비스를 개시하여 제공하고 있음(<그림 16> 참조).

- 한 BBC에서는 2012년부터 링크드 데이터를 활용하여 BBC News를

한 시맨틱 로토타이핑 랫폼인 BBC News Juicer 시작함.

Page 34: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

28도서관 분야의 링크드 데이터 구축 동향

<그림 16> 링크드 데이터 기반 BBC Music The Beatles 서비스

<그림 17> BBC News Juicer 서비스

Page 35: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

29 KISTI 지식리포트 제40호

5. 결론 및 제언

☐ 본 보고서는 도서 의 링크드 오 데이터 서비스 동향을 살펴보고 향후

발 된 서비스 방안을 제시하는 것이 목 임.

☐ 이를 해 간단히 시맨틱 웹과 링크드 데이터에 한 정의와 링크드 데이

터의 원칙을 살펴보고, 도서 링크드 데이터의 가장 실용 인 지침인

W3C Library Linked Data Final Report의 요 내용을 검하 으며,

표 인 도서 링크드 데이터 사례를 3가지 에서 제시함.

- 첫 번째 은 국 등 국립도서 들의 소장정보에 한 링크드 데이

터화와 발행이며, 두 번째는 OCLC의 WorldCat, VIAF 등과 같이 웹에

서의 근성 향상과 값 어휘집 제공 사례, 세 번째는 미국 의회도서 의

BIBFRAME으로 데이터 웹에 한 개념 인 근 사례임.

☐ 이 와 별개로 도서 이 가지고 있는 데이터가 단순히 서지, 거 데이터뿐

만 아니라 이용자와도 련된 데이터가 존재하며 이의 유의미한 활용이 가

능하다는 도 제시함.

☐ 링크드 데이터를 기반으로 발 된 서비스 방향 설정을 해서 3가지의

근 을 제시함.

- 첫 번째는 데이터를 심으로 하는 새로운 웹 생태계 구성에 참여할 필

요가 있으며 이를 해서는 리, 소장하고 있는 데이터에 한 분석과

링크드 데이터 원칙을 수한 데이터 발행이 필요함을 언 하 음. 이것

은 웹에 새로운 데이터 생태계를 구성하는데 참여하고 있다는 거시 인

과 발 방향 설정이 필요함을 지 한 것임.

- 두 번째는 하나의 데이터로써 링크드 데이터를 바라볼 필요가 있으며, 이

는 연구자(기 ) 혹은 링크드 데이터를 실용 으로 활용해야하는 자(기 )

에게 효율 인 근 을 제시해 수 있는 서비스 이 필요함을 지

한 것임. 한 링크드 데이터의 핵심인 연결은 데이터의 연결뿐만 아니

라 뒤에 존재하는 조직 인 인 라의 유 와 결속이 요함을 지 하 음.

- 마지막은 구조화된 데이터의 발행과 근 향상으로 링크드 데이터가

기존의 소통방식과 다른 형태를 취하고 있으나 역시 데이터를 교환하고

Page 36: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

30도서관 분야의 링크드 데이터 구축 동향

상호운용성을 확보하고 데이터의 재사용성과 활용성을 높인다는 에

서 동일선상의 개방형 데이터 정책으로 볼 필요가 있음을 지 한 것임.

한 이미 개방된 링크드 데이터를 직 으로 업무나 서비스에 활용할

수 있는 방안 수립도 필요함을 언 하 음.

☐ 본 보고서의 범 는 도서 을 기본 도메인으로 하고 있으며, 주요 내용은

정보자원 리 기 이 개념 으로 링크드 데이터에 해 근할 수 있도록

하고 재 시 에서 필요한 것이 무엇이며, 이를 바탕으로 향후 추진해야하

는 방향과 과제가 무엇인지를 알아보는데 을 두고 있음.

☐ 링크드 데이터가 웹에서 보다 효과 인 소통 방식임을 직시하고, 링크드 데

이터 발행자( 리자), 소비자로써의 역할로 근하여 정책을 설정하고 실행

계획을 수립하는 것이 필요함.

Page 37: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

31 KISTI 지식리포트 제40호

<참고문헌>

박진호 (2013a, 7월). 도서 은 웹에 존재하는가? : 링크드 데이터, 로벌 데이

터베이스. 국가 자도서 세미나. 경기도 : 국가기록원

박진호. (2013b). 도서 데이터의 링크드 데이터(Linked Data) 변환과 인터링

킹(interlinking)을 통한 정보연계 확장성에 한 연구 : 국립 앙도서

서지, 주제명, 자명 데이터를 심으로. 석사학 논문, 성균 학교,

서울.

Berners-Lee, T., Hendler, J., & Lassila, O. (2001). The semantic web.

Scientific american, 284(5), 28-37.

Berners-Lee, T. (1998). Semantic web road map, September 1998. W3C

Draft http://www. w3. org/DesignIssues/Semantic. html.

Berners-Lee, T. (2007). Giant global graph. online posting, Networks,”

Proceedings of the National Academy of Sciences of the United

States of America, 98, 404-9.

Berners-Lee, T. (2011). Design issues: Linked data (2006). URL

http://www. w3. org/DesignIssues/LinkedData. html.

Blumauer, Andreas. (2013, June 7). The LOD cloud is dead, long live the

trusted LOD cloud. Retrieved from http://blog.semantic-web.at/2013/

06/07/the-lod-cloud-is-dead-long-live-the-trusted-lod-cloud/

Voß, Jakob. (2012, November). Encoding Patron Information in RDF. Paper

presented at the Semantic Web in Libraries(SWIB12) Conference,

Cologne, Germany.

W3C. (n.d.). W3C SEMANTIC WEB ACTIVITY. Retrieved from

http://www.w3.org/2001/sw/

Page 38: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼
Page 39: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

◀ 저 자 ▶

현 미 환 ⋅KISTI NDSL서비스실 선임연구원

[email protected]

김 완 종 ⋅KISTI NDSL서비스실 선임연구원

[email protected]

이 혜 진 ⋅KISTI NDSL서비스실 선임연구원

[email protected]

유 수 현 ⋅KISTI NDSL서비스실 선임연구원

[email protected]

김 혜 선 ⋅KISTI NDSL서비스실장

[email protected]

박 진 호 ⋅성균관대학교 문헌정보학과

[email protected]

KISTI 지식리포트 제40호

도서관 분야의 링크드 데이터 구축 동향

인 쇄 2014년 1월 6일

발 행 2014년 1월 7일

펴낸곳

펴낸이 박영서

편집인 김혜선

주 소 서울시 동대문구 회기로 66

고객센터(ARS) 080-969-4114

등 록 1991. 2. 12, 제5-258호

ISBN 978-89-294-0464-2 93020

인쇄처 승림디엔씨

※ 본 연구의 내용은 본 연구원의 공식적인 견해가 아닌 참여 연구원들의 의견임을 밝혀둔다.

Page 40: KISTI 지식리포트 제40호 · 도서관 분야의 링크드 데이터 구축 동향 4-특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼

□ KISTI 지식리포트 발행 목록

호 서명 저자 발간일

1 학술지 수집 정책 수립을 한 국내 황 분석 이재윤, 김혜선, 이혜진 2009.06.11

2 국내 과학기술지식의 로벌 확산 략 서태설, 최 규 2009.09.04

3 국가 과학기술 진흥을 한 KISTI의 략 정보자원 개발방안 황혜경, 최호남, 윤희윤 2009.09.21

4 학술논문 오 액세스를 한 공공 근정책 방향 서태설, 허 선, 노경란 2009.10.23

5 과학데이터의 공유와 활용 이상환, 심원식 2009.11.10

6 E.infrastructure기반 국가 R&D 정보서비스의 지능화 방안 송인석, 오세홍 2009.12.04

7 한국과학기술인용색인서비스(KSCI)의 황 발 략 최선희, 이재윤 2010.01.29

8 학술정보센터의 새로운 서비스 모델 : 오 액세스 출 노경란, 이혜진 2010.02.11

9 과학기술정보의 아카이빙 체제 구축 황혜경, 이선희, 최호남, 서혜란 2010.02.16

10 세계 주요 과학기술 정보기 의 최근 동향이상환, 노경란, 김혜선,

황혜경, 정은경2010.03.02

11 과학기술 정보자료 보존 리 : 황분석 미래 측이선희, 황혜경, 류범종,

윤희윤, 김석2010.06.30

12 리포지터리 사례분석 시사 도출 이상기, 정 미 2010.10.07

13 디지털 콘텐츠 유통을 한 작권 쟁 분석 유수 2010.10.07

14 이공계 학 교수의 과학기술정보 이용 황 김환민, 김재훈 2010.12.02

15 계량서지 분석용 공개 소 트웨어 활용 방안 최선희, 김희정, 이재윤 2011.01.24

16 2010년도 한국 과학자의 SCI 논문 계량분석 김완종, 노경란, 박민수, 최 규 2011.04.06

17 국내 과학기술정보 이용실태 조사 분석 박민수, 이상환, 최 규, 정정수 2011.04.08

18 국내 과학기술정보 이용자 니즈 형태 연구 박민수, 이상환, 최 규, 정정수 2011.04.08

19 학술지 유통환경 변화와 국내 학술지의 국제화 서태설, 김규환, 최 규 2011.06.07

20우리나라 SCI 논문의 향력 분석 : NCR for Korea 1981-2010을 기 으로

김완종, 노경란, 최 규, 박민수 2011.08.17

21 연구자들의 소셜 미디어 이용 노경란, 최 규 2011.10.19

22 연구자를 한 소셜 미디어 활용 가이드 노경란, 최 규 2011.10.19

23 서비스 사이언스 기반 과학기술 콘텐츠 서비스 방안김지 , 신기정, 황혜경,

조부연2011.10.26

24 효율 연구를 한 소셜 미디어 활용 노경란, 유수 , 최 규 2011.11.09

25 SEO(검색엔진최 화)를 통한 검색순 올리기 략 미환, 이태석, 문 수, 권정 2011.11.11

26 연구자 업지원형 정보서비스 사례연구이혜진, 미환, 김혜선,

박민수, 최 규2011.12.01

27과학기술 R&D 라이 사이클 연구 : 생명공학 나노분야를

심으로김혜선, 권나 , 정은경,

이정연, 최 규2011.11.30

28 웹사이트의 사용성 개선을 한 단계별 략 미환, 박민수, 이태석, 최 규 2011.12.05

29 국내 과학기술 연구자의 소셜 미디어 활용 황미환, 이혜진, 김혜선,

박민수, 최 규2011.12.08

30 이용 황 분석을 통한 학술정보 활용지표 개발 이혜진, 유수 , 김혜선, 이재윤 2012.01.31

31 FTA와 개정 작권법이 정보유통에 미치는 향 유수 , 이 희 2012.02.21

32 고품질 정보서비스 지원을 한 컴퓨 자원 인 라 구축정 임, 신용주, 한성근, 김재훈,

김정환, 최호남2012.03.30

33 모바일 앱(App) 개발을 한 특화 기술 분석 미환, 신수미, 김혜선 2012.08.10

34 한국과학기술정보연구원(KISTI) 원문제공서비스 황 분석 이선희, 김지 , 문 수, 신기정 2012.12.31

35 정보서비스 공공기 검색엔진 활용 만족도 조사이태석, 신수미, 유수 ,

정용일, 이은정2013.07.31

36 국내외 오 액세스 기술 서비스 동향 이은지, 미환, 김완종, 김혜선 2013.11.29

37 학술정보의 공개 공유를 한 법 쟁 유수 , 김완종, 김혜선, 최진원 2013.12.06

38 정보 공유를 한 국내외 OpenAPI 서비스 동향 미환, 신수미, 김혜선 2013.12.10

39 클라우드 기반 정보서비스 동향 사례 신수미, 미환, 김혜선 2013.12.13