39
디디디 디디디 디디 디디 2004. 11. 19 디 디 디 ( 디디디디디 디디디디디디 )

디지털 유산의 보존 방안

  • Upload
    verdi

  • View
    74

  • Download
    0

Embed Size (px)

DESCRIPTION

디지털 유산의 보존 방안. 2004. 11. 19 서 혜 란 ( 신라대학교 문헌정보학과 ). 디지털 유산 (Digital heritage). 개념 인류의 지식과 표현을 디지털 형태로 나타낸 자료로서 그 영속적인 가치와 중요성 때문에 현재 및 미래 세대를 위해 보존해야 하는 것 디지털 형태로 생산된 것 (born-digital) / 디지털 형태로 변환된 것 (digitalized) 문화 , 교육 , 학술 , 행정 , 정보 ( 기술 , 법률 , 의학 등 ) 적 목적 - PowerPoint PPT Presentation

Citation preview

Page 1: 디지털 유산의 보존 방안

디지털 유산의 보존 방안

2004. 11. 19

서 혜 란( 신라대학교 문헌정보학과 )

Page 2: 디지털 유산의 보존 방안

2

디지털 유산 (Digital heritage)• 개념

– 인류의 지식과 표현을 디지털 형태로 나타낸 자료로서 그 영속적인 가치와 중요성 때문에 현재 및 미래 세대를 위해 보존해야 하는 것

• 디지털 형태로 생산된 것 (born-digital) / 디지털 형태로 변환된 것 (digitalized)

• 문화 , 교육 , 학술 , 행정 , 정보 ( 기술 , 법률 , 의학 등 )적 목적

• texts, databases, still and moving images, audio, graphics, software, web pages etc.

Unesco. 2003. Guidelines for the Preservation of Digital Heritage.

Page 3: 디지털 유산의 보존 방안

3

디지털 유산 (Digital heritage)• 특성

– 양적 성장– 단명성

• 물리적• 기술적• 내용적

– 새로운 소유와 접근 모델• “ 디지털 암흑시대” 시나리오 디지털 보존의 필요성 대두

Page 4: 디지털 유산의 보존 방안

4

디지털보존 (Digital Preservation)

• 개념– RLG/OCLC Working Group on Digital Archival

Attributes (2002) Trusted Digital Repositories: Attributes and Responsibilities.

• Bit stream 의 장기적 유지관리• 내용에 대한 지속적 접근성 제공

Page 5: 디지털 유산의 보존 방안

5

디지털 보존 (Digital Preservation)• 개념

– Garrett & Waters (1996) Preserving Digital Information: Report of the Task Force on Archiving of Digital Information.

• 디지털정보의 무결성 (integrity) 을 유지하는 것• 무결성의 조건

– 내용 (content)– 고정 (fixity)– 참조 (reference)– 출처 (provenance)– 맥락 (context)

Page 6: 디지털 유산의 보존 방안

6

디지털 보존 (Digital Preservation)• 개념

– Graham (1994) Intellectual Preservation: Electronic Preservation of the Third Kind.

• 디지털 보존의 세 측면– medium preservation– technology preservation– intellectual preservation

» integrity and authenticity of the information as originally recorded

» accidental change, intentional change that is well meant, intentional change that is not well meant(fraud) 각각에 대한 보존전략

Page 7: 디지털 유산의 보존 방안

7

디지털유산 보존의 책임• 디지털보존소의 속성

– OAIS 참조모델 준수– 행정적 책임– 조직의 능력– 재정적 유지 능력– 기술적 , 절차적 적절성– 시스템 안전성– 절차적 책임성

RLG/OCLC (2002) Trusted Digital Repositories: Attributes and Responsibilities.

Page 8: 디지털 유산의 보존 방안

8

디지털유산 보존의 책임• 생산자와의 협력

– 생산자 : 기획자 , 저자 , 출판자 , 소프트웨어개발자 , 배포자 등

– 생산자와의 협력 필요성– 협력의 방법과 내용

• 생산자대표와의 협상 + 개별적 협상• 보존을 통한 상호이익의 확인• 지침의 개발

– 사례• Elsevier Science 와 KB

Page 9: 디지털 유산의 보존 방안

9

디지털유산 보존의 책임• 디지털자료의 납본

– 납본의 필요성• “[ 유네스코 ] 회원국에는 자국의

디지털유산보존에 적절한 법적 제도적 장치가 필요하다 . 국가적 보존정책의 핵심요소로서 … 법정납본 또는 자발적 납본 대상에 디지털유산이 반드시 포함되어야 한다 .”(Unesco. 2003. Charter on the Preservation of the Digital Heritage. 제 8 항 )

Page 10: 디지털 유산의 보존 방안

10

디지털유산보존의 책임• 디지털자료의 납본

– 디지털유산의 납본 사례• 오프라인

– 한국 , 일본 , 미국 • 온라인

– 영국 , 프랑스 , 독일 , 핀란드 , 스웨덴 , 덴마크– 네덜란드 ( 자발적 납본 )

Page 11: 디지털 유산의 보존 방안

11

OAIS Reference Model

• 디지털자료의 장기보존과 지속적 접근제공을 위한 개념적 모델• 1999 년 CCSDS 의 Red Book 발표• 2002 년 CCSDS 의 Blue Book 발표• 2003 년 ISO/TC 20, SC13 에 의해 국제표준 ISO 14721 로 채택

Page 12: 디지털 유산의 보존 방안

12

OAIS Reference Model

• 수용사례– NEDLIB(Networked European Deposit LIBrar

y)– Cedars(CURL Exemplars in Digital Archives)– PANDORA(Preserving and Accessing Network

ed Documentary Resources of Australia)– ERA(Electronic Records Archives)

Page 13: 디지털 유산의 보존 방안

13

OAIS Reference Model

Page 14: 디지털 유산의 보존 방안

14

보존 메타데이터

• 내용정보 (CI)– 표현정보 (representation information)

• 보존기술정보 (PDI)– 참조정보 (reference information)– 출처정보 (provenance information)– 맥락정보 (context information)– 고정정보 (fixity information)

Page 15: 디지털 유산의 보존 방안

15

보존 메타데이터

• 주요 보존 메타데이터 요소 명세– National Library of Australia (1999) Preservation Metad

ata for Digital Collections. – CEDARS (2000) Metadata for Digital Preservation: the

CEDARS Project Outline Specification.– NEDLIB (2000) Metadata for Long Term Preservation. – OCLC/RLG Working Group on Preservation Metadata

(2002) Preservation Metadata and the OAIS Information Model: a Metadata Framework to Support the Preservation of Digital Objects.

Page 16: 디지털 유산의 보존 방안

16

디지털유산의 보존전략• 단기 보존전략

– refreshing– technology preservation

• 중장기 보존전략– migration– emulation

• 기타

Page 17: 디지털 유산의 보존 방안

17

디지털유산의 보존전략• 보존전략 선정의 고려사항

– 기술적 타당성– 비용 - 효과성– 법적 제약– 출판사와의 협정– 이용자의 접근 조건

• 서로 다른 보존전략의 복합적 적용

Page 18: 디지털 유산의 보존 방안

18

Emulation

• 개념– 디지털자료는 원래의 포맷을 유지한 채 보존하면서 소프트웨어와 하드웨어의 에뮬레이터를 채택하여 미래의 새로운 시스템에서 퇴화된 시스템을 흉내내게 함으로써 접근할 수 있게 하는 보존전략

• 장점– 디지털자료의 내용뿐만 아니라 기능성과 ‘ look & feel’ 을 유지할 수 있다 .

Page 19: 디지털 유산의 보존 방안

19

Emulation

• 단점– 에뮬레이터의 명세 작성이 복잡하다 .– 대량의 정보를 보존해야 한다 .– 비용문제가 아직 불확실하다 .

• 적용 대상– 실행파일을 포함하고 있는 복합적 디지털자료

( 예 : 게임 )– ‘look & feel’ 이 중요한 자료

Page 20: 디지털 유산의 보존 방안

20

Migration

• 개념– 디지털자료를 하나의 하드웨어 / 소프트웨어 구성 (configuration) 에서 다른 구성으로 , 또는 차세대 컴퓨터기술로 정기적으로 이전시키는 보존전략

• 장점– 변화하는 기술환경에서 이용자들이 지속적으로 검색 , 현시 및 이용할 수 있다 .

Page 21: 디지털 유산의 보존 방안

21

Migration

• 단점– 장기보존에 상당한 비용이 소요된다 .– 보존관리자의 지속적 노력이 필요하다 .– 데이터의 손실 , 기능성과 ‘ look & feel’ 의 손상 위험이 크다 .

• 적용대상– 포맷이 잘 알려져 있는 디지털자료– 접근과 관리가 활발하게 이루어지고 있는 자료

Page 22: 디지털 유산의 보존 방안

22

국제 디지털유산 보존 활동• Unesco

– 2001 년 10 월 제 31 차 총회에서 Resolution on Preserving Our Digital Heritage 채택

– 2003 년 3 월 Guidelines for the Preservation of Digital Heritage 발표

– 2003 년 10 월 제 32 차 총회에서 Charter on the Preservation of the Digital Heritage 채택

Page 23: 디지털 유산의 보존 방안

23

국제 디지털유산 보존 활동• International Internet Preservation Consortium(IIP

C)http://netpreserve.org/– 2003 년 7 월 결성된 11 개 국가도서관과 Internet

Archive 의 컨소시엄– 목표

• 범세계적 인터넷 콘텐츠의 수집• 관련 도구 , 기술 , 표준의 개발과 활용 촉진• 각국 국가도서관의 인터넷 아카이빙과 보존 촉진

Page 24: 디지털 유산의 보존 방안

24

국내의 디지털유산 보존 활동• 국립중앙도서관

– 1988 년부터 ‘전산화자료’를 법정납본 받아 보존 활용

– 현재 온라인자료는 법정납본대상에서 제외– 2001 년 12 월 , 온라인저작물수집 및 보존에 대한

ISP 수립 및 시스템 개발– 2003 년 12 월 , 온라인디지털자원수집전담팀 구

성 , 수집 시작– 2004 년 2 월 , 온라인디지털자원심의운영위원회

구성 , 온라인디지털자원의 선정지침 마련

Page 25: 디지털 유산의 보존 방안

25

국내의 디지털유산 보존 활동• 국립중앙도서관

– 수집기준과 범위• 처음부터 온라인으로 생산된 자원 우선• 한국에서 생산된 자원 ( 도메인 이름 .kr)• 해외에서 생산된 자원 중 한국인이 저자인 자원 또는 한국을

주제로 한 자원• 현재 또는 미래의 정보요구를 충족시킬 수 있는 자원• 포함자료

– 행정기관 , 대학 , 연구소의 자원 , 회의자료 , 전자저널 , 사회적 이슈

• 제외자료– 블로그 , 토론과 채팅 , 게시판과 뉴스그룹 , 포털사이트 , 광고

Page 26: 디지털 유산의 보존 방안

26

제1단계 제2단계 제3단계

선 정 수 집 편 목 / 분 류

보 존 평 가 저작권처리 보 존 처 리

등록번호부여 K OL IS등록 이용자서비스

Page 27: 디지털 유산의 보존 방안

27

국내의 디지털유산 보존 활동• 국립중앙도서관

– 구축현황• 180 여 개의 중앙행정기관 , 정부투자기관 , 정부출연연구소

등이 생산한 간행물 및 연구보고서 14,000 건• 제 17 대 국회의원 후보자 홈페이지 900 건• 지역축제 홈페이지 30 여건

– 웹로봇의 설계와 실용화– 향후 계획

• 추천받은 28 개 주제분야의 7,000 개 URL 수집• 저작권 처리• 보존정책 수립

Page 28: 디지털 유산의 보존 방안

28

국내의 디지털유산 보존 활동• 정보트러스트운동 http://www.infotrust.or.kr

– 2003 년 정보트러스트운동 추진위원회 (다음세대재단 , 문화연대 , 사이버문화연구소 , 정보공유연대 , 진보네트워크센터 , 함께하는 시민행동의 연대기구 ) 발족

– 2004 년 정보트러스트센터– 인터넷 상에서 사라져 가고 있는 디지털 정보를

복원하고 , 보존할 가치가 있는 사이버공간의 지식과 정보를 시민들의 자발적 참여와 모금으로 공공화하는 운동

– 인터넷 연표 제작

Page 29: 디지털 유산의 보존 방안

29

국내의 디지털유산 보존활동• 다음세대재단

– 2002 년 대통령선거 웹 아카이빙 실험• 2002.12.13 - 2003.3.30• 대통령선거 관련 웹 사이트 수집 실험

– @2004• 다음커뮤니케이션 직원으로 구성된

자원봉사팀이 2004 년 6 월 9 일 하루동안 한국 인터넷을 나타내는 다양한 디지털 객체를 수집하여 정보트러스트센터에 기부

Page 30: 디지털 유산의 보존 방안

30

해외의 디지털유산 보존활동• PANDORA

http://pandora.nla.gov.au– 성격

• National Library of Australia 의 주도 아래 납본권한을 가진 주립도서관 등 9 개 기관이 참여하는 협력사업

• 호주의 온라인출판물의 장기보존과 활용을 목적으로 1996 년부터 시작

Page 31: 디지털 유산의 보존 방안

31

해외의 디지털유산 보존활동• PANDORA

– 선택과 수집• 호주에 관련된 인터넷 출판물로서 권위와 장기적

가치가 인정되며 오직 온라인 형태만 존재하는 것• 참여기관마다 자관의 선택지침에 따라 선정 • 선정된 웹 사이트는 저작권자의 동의를 얻은 후

수집• 수집로봇 (HTTrack + Teleport Pro) 에 의한 수집과

CD-ROM, FTP, E-mail 을 활용한 출판자의 제출 • 대개 정기적 capture 를 통해 업데이트

Page 32: 디지털 유산의 보존 방안

32

해외의 디지털유산보존 활동• PANDORA

– 저장과 장기보존• PANDAS(PANDORA Digital Archiving System)

– NLA 가 자체 개발한 디지털아카이브 관리시스템

• 각 기관은 NLA 의 중앙 아카이브에 원격저장 및 다운로드

• 수집된 웹 자원은 MARC 로 편목하여 국가서지 및 수집기관의 자관 목록에 수록

• 장기보존의 기본지침을 설정하고 다양한 실험과 연구 진행

Page 33: 디지털 유산의 보존 방안

33

해외의 디지털유산보존 활동 • PANDORA

– 이용• 수집된 웹 자원은 대부분 인터넷 상에서

자유로운 접근 가능• 일부 상업출판물은 출판자가 지정한 기간 동안

수집기관의 열람실에서만 이용 가능• 메뉴방식에 의한 주제별 브라우징과 키워드 검색이 모두 가능

Page 34: 디지털 유산의 보존 방안

34

해외의 디지털유산보존 활동• Kulturarw3

– http://www.kb.se/kw3/– 성격

• 1996 년부터 스웨덴국가도서관 (KB) 이 스웨덴온라인출판물의 수집 , 보존 , 접근 , 활용방법 모색을 목적으로 수행– 선택과 수집

• 스웨덴 전자문헌의 포괄적 수집• 수집로봇 (Combine) 에 의한 대량수집

Page 35: 디지털 유산의 보존 방안

35

해외의 디지털유산보존활동• Kulturarw3

– 저장과 장기보존• 수집된 파일은 마그네틱테이프와 디스크에

고정하여 서버에 저장• 마이그레이션과 에뮬레이션을 혼용한다는

기본입장을 가지고 관련 실험과 평가 계속 중– 이용

• 2003 년 6 월부터 법에 의해 일반인에게 이용 제공• KB 내의 터미널에서만 접근 가능

Page 36: 디지털 유산의 보존 방안

36

해외의 디지털유산보존활동• Internet Archive

– http://www.archive.org– 성격

• B. Kahle 의 주도로 1996 년 설립된 미국 샌프란시스코에 위치한 비영리단체

• 디지털형태로 존재하는 역사적 정보자원에 영구적으로 접근할 수 있는 인터넷도서관 구축을 목표로 하는 프로젝트

– 선택과 수집• 수집범위에 제한 없이 세계적 차원에서 광범위한

수집• 자체 개발한 수집용 로봇

Page 37: 디지털 유산의 보존 방안

37

해외의 디지털유산보존 활동• Internet Archive

– 저장과 장기보존• 분산저장• 마이그레이션과 에뮬레이션

– 이용• 연구자 , 역사가와 학자들을 서비스 대상으로 설정• 누구에게나 무료 접근 허용• Wayback Machine• Recall

Page 38: 디지털 유산의 보존 방안

38

참고정보원• PADI(Preserving Access to Digital Information)

http://www.nla.gov.au/padi• ERPANET(Electronic Resource Preservation and Acce

ss NETwork) http://www.erpanet.org

• DPC(Digital Preservation Coalition)http://www.dpconline.org

• OCLC(Online Computer Library Center)http://www.oclc.org/digitalpreservation

Page 39: 디지털 유산의 보존 방안

39

참고정보원• RLG(Research Libraries Group)

http://www.rlg.org/longterm• Digital-Preservation. JISC

http://www.jiscmail.ac.uk/lists/digital-preservation.htmal

• Padiforum-1http://www.nla.gov.au/padi/forum