Upload
verdi
View
74
Download
0
Embed Size (px)
DESCRIPTION
디지털 유산의 보존 방안. 2004. 11. 19 서 혜 란 ( 신라대학교 문헌정보학과 ). 디지털 유산 (Digital heritage). 개념 인류의 지식과 표현을 디지털 형태로 나타낸 자료로서 그 영속적인 가치와 중요성 때문에 현재 및 미래 세대를 위해 보존해야 하는 것 디지털 형태로 생산된 것 (born-digital) / 디지털 형태로 변환된 것 (digitalized) 문화 , 교육 , 학술 , 행정 , 정보 ( 기술 , 법률 , 의학 등 ) 적 목적 - PowerPoint PPT Presentation
Citation preview
디지털 유산의 보존 방안
2004. 11. 19
서 혜 란( 신라대학교 문헌정보학과 )
2
디지털 유산 (Digital heritage)• 개념
– 인류의 지식과 표현을 디지털 형태로 나타낸 자료로서 그 영속적인 가치와 중요성 때문에 현재 및 미래 세대를 위해 보존해야 하는 것
• 디지털 형태로 생산된 것 (born-digital) / 디지털 형태로 변환된 것 (digitalized)
• 문화 , 교육 , 학술 , 행정 , 정보 ( 기술 , 법률 , 의학 등 )적 목적
• texts, databases, still and moving images, audio, graphics, software, web pages etc.
Unesco. 2003. Guidelines for the Preservation of Digital Heritage.
3
디지털 유산 (Digital heritage)• 특성
– 양적 성장– 단명성
• 물리적• 기술적• 내용적
– 새로운 소유와 접근 모델• “ 디지털 암흑시대” 시나리오 디지털 보존의 필요성 대두
4
디지털보존 (Digital Preservation)
• 개념– RLG/OCLC Working Group on Digital Archival
Attributes (2002) Trusted Digital Repositories: Attributes and Responsibilities.
• Bit stream 의 장기적 유지관리• 내용에 대한 지속적 접근성 제공
5
디지털 보존 (Digital Preservation)• 개념
– Garrett & Waters (1996) Preserving Digital Information: Report of the Task Force on Archiving of Digital Information.
• 디지털정보의 무결성 (integrity) 을 유지하는 것• 무결성의 조건
– 내용 (content)– 고정 (fixity)– 참조 (reference)– 출처 (provenance)– 맥락 (context)
6
디지털 보존 (Digital Preservation)• 개념
– Graham (1994) Intellectual Preservation: Electronic Preservation of the Third Kind.
• 디지털 보존의 세 측면– medium preservation– technology preservation– intellectual preservation
» integrity and authenticity of the information as originally recorded
» accidental change, intentional change that is well meant, intentional change that is not well meant(fraud) 각각에 대한 보존전략
7
디지털유산 보존의 책임• 디지털보존소의 속성
– OAIS 참조모델 준수– 행정적 책임– 조직의 능력– 재정적 유지 능력– 기술적 , 절차적 적절성– 시스템 안전성– 절차적 책임성
RLG/OCLC (2002) Trusted Digital Repositories: Attributes and Responsibilities.
8
디지털유산 보존의 책임• 생산자와의 협력
– 생산자 : 기획자 , 저자 , 출판자 , 소프트웨어개발자 , 배포자 등
– 생산자와의 협력 필요성– 협력의 방법과 내용
• 생산자대표와의 협상 + 개별적 협상• 보존을 통한 상호이익의 확인• 지침의 개발
– 사례• Elsevier Science 와 KB
9
디지털유산 보존의 책임• 디지털자료의 납본
– 납본의 필요성• “[ 유네스코 ] 회원국에는 자국의
디지털유산보존에 적절한 법적 제도적 장치가 필요하다 . 국가적 보존정책의 핵심요소로서 … 법정납본 또는 자발적 납본 대상에 디지털유산이 반드시 포함되어야 한다 .”(Unesco. 2003. Charter on the Preservation of the Digital Heritage. 제 8 항 )
10
디지털유산보존의 책임• 디지털자료의 납본
– 디지털유산의 납본 사례• 오프라인
– 한국 , 일본 , 미국 • 온라인
– 영국 , 프랑스 , 독일 , 핀란드 , 스웨덴 , 덴마크– 네덜란드 ( 자발적 납본 )
11
OAIS Reference Model
• 디지털자료의 장기보존과 지속적 접근제공을 위한 개념적 모델• 1999 년 CCSDS 의 Red Book 발표• 2002 년 CCSDS 의 Blue Book 발표• 2003 년 ISO/TC 20, SC13 에 의해 국제표준 ISO 14721 로 채택
12
OAIS Reference Model
• 수용사례– NEDLIB(Networked European Deposit LIBrar
y)– Cedars(CURL Exemplars in Digital Archives)– PANDORA(Preserving and Accessing Network
ed Documentary Resources of Australia)– ERA(Electronic Records Archives)
13
OAIS Reference Model
14
보존 메타데이터
• 내용정보 (CI)– 표현정보 (representation information)
• 보존기술정보 (PDI)– 참조정보 (reference information)– 출처정보 (provenance information)– 맥락정보 (context information)– 고정정보 (fixity information)
15
보존 메타데이터
• 주요 보존 메타데이터 요소 명세– National Library of Australia (1999) Preservation Metad
ata for Digital Collections. – CEDARS (2000) Metadata for Digital Preservation: the
CEDARS Project Outline Specification.– NEDLIB (2000) Metadata for Long Term Preservation. – OCLC/RLG Working Group on Preservation Metadata
(2002) Preservation Metadata and the OAIS Information Model: a Metadata Framework to Support the Preservation of Digital Objects.
16
디지털유산의 보존전략• 단기 보존전략
– refreshing– technology preservation
• 중장기 보존전략– migration– emulation
• 기타
17
디지털유산의 보존전략• 보존전략 선정의 고려사항
– 기술적 타당성– 비용 - 효과성– 법적 제약– 출판사와의 협정– 이용자의 접근 조건
• 서로 다른 보존전략의 복합적 적용
18
Emulation
• 개념– 디지털자료는 원래의 포맷을 유지한 채 보존하면서 소프트웨어와 하드웨어의 에뮬레이터를 채택하여 미래의 새로운 시스템에서 퇴화된 시스템을 흉내내게 함으로써 접근할 수 있게 하는 보존전략
• 장점– 디지털자료의 내용뿐만 아니라 기능성과 ‘ look & feel’ 을 유지할 수 있다 .
19
Emulation
• 단점– 에뮬레이터의 명세 작성이 복잡하다 .– 대량의 정보를 보존해야 한다 .– 비용문제가 아직 불확실하다 .
• 적용 대상– 실행파일을 포함하고 있는 복합적 디지털자료
( 예 : 게임 )– ‘look & feel’ 이 중요한 자료
20
Migration
• 개념– 디지털자료를 하나의 하드웨어 / 소프트웨어 구성 (configuration) 에서 다른 구성으로 , 또는 차세대 컴퓨터기술로 정기적으로 이전시키는 보존전략
• 장점– 변화하는 기술환경에서 이용자들이 지속적으로 검색 , 현시 및 이용할 수 있다 .
21
Migration
• 단점– 장기보존에 상당한 비용이 소요된다 .– 보존관리자의 지속적 노력이 필요하다 .– 데이터의 손실 , 기능성과 ‘ look & feel’ 의 손상 위험이 크다 .
• 적용대상– 포맷이 잘 알려져 있는 디지털자료– 접근과 관리가 활발하게 이루어지고 있는 자료
22
국제 디지털유산 보존 활동• Unesco
– 2001 년 10 월 제 31 차 총회에서 Resolution on Preserving Our Digital Heritage 채택
– 2003 년 3 월 Guidelines for the Preservation of Digital Heritage 발표
– 2003 년 10 월 제 32 차 총회에서 Charter on the Preservation of the Digital Heritage 채택
23
국제 디지털유산 보존 활동• International Internet Preservation Consortium(IIP
C)http://netpreserve.org/– 2003 년 7 월 결성된 11 개 국가도서관과 Internet
Archive 의 컨소시엄– 목표
• 범세계적 인터넷 콘텐츠의 수집• 관련 도구 , 기술 , 표준의 개발과 활용 촉진• 각국 국가도서관의 인터넷 아카이빙과 보존 촉진
24
국내의 디지털유산 보존 활동• 국립중앙도서관
– 1988 년부터 ‘전산화자료’를 법정납본 받아 보존 활용
– 현재 온라인자료는 법정납본대상에서 제외– 2001 년 12 월 , 온라인저작물수집 및 보존에 대한
ISP 수립 및 시스템 개발– 2003 년 12 월 , 온라인디지털자원수집전담팀 구
성 , 수집 시작– 2004 년 2 월 , 온라인디지털자원심의운영위원회
구성 , 온라인디지털자원의 선정지침 마련
25
국내의 디지털유산 보존 활동• 국립중앙도서관
– 수집기준과 범위• 처음부터 온라인으로 생산된 자원 우선• 한국에서 생산된 자원 ( 도메인 이름 .kr)• 해외에서 생산된 자원 중 한국인이 저자인 자원 또는 한국을
주제로 한 자원• 현재 또는 미래의 정보요구를 충족시킬 수 있는 자원• 포함자료
– 행정기관 , 대학 , 연구소의 자원 , 회의자료 , 전자저널 , 사회적 이슈
• 제외자료– 블로그 , 토론과 채팅 , 게시판과 뉴스그룹 , 포털사이트 , 광고
26
제1단계 제2단계 제3단계
선 정 수 집 편 목 / 분 류
보 존 평 가 저작권처리 보 존 처 리
등록번호부여 K OL IS등록 이용자서비스
27
국내의 디지털유산 보존 활동• 국립중앙도서관
– 구축현황• 180 여 개의 중앙행정기관 , 정부투자기관 , 정부출연연구소
등이 생산한 간행물 및 연구보고서 14,000 건• 제 17 대 국회의원 후보자 홈페이지 900 건• 지역축제 홈페이지 30 여건
– 웹로봇의 설계와 실용화– 향후 계획
• 추천받은 28 개 주제분야의 7,000 개 URL 수집• 저작권 처리• 보존정책 수립
28
국내의 디지털유산 보존 활동• 정보트러스트운동 http://www.infotrust.or.kr
– 2003 년 정보트러스트운동 추진위원회 (다음세대재단 , 문화연대 , 사이버문화연구소 , 정보공유연대 , 진보네트워크센터 , 함께하는 시민행동의 연대기구 ) 발족
– 2004 년 정보트러스트센터– 인터넷 상에서 사라져 가고 있는 디지털 정보를
복원하고 , 보존할 가치가 있는 사이버공간의 지식과 정보를 시민들의 자발적 참여와 모금으로 공공화하는 운동
– 인터넷 연표 제작
29
국내의 디지털유산 보존활동• 다음세대재단
– 2002 년 대통령선거 웹 아카이빙 실험• 2002.12.13 - 2003.3.30• 대통령선거 관련 웹 사이트 수집 실험
– @2004• 다음커뮤니케이션 직원으로 구성된
자원봉사팀이 2004 년 6 월 9 일 하루동안 한국 인터넷을 나타내는 다양한 디지털 객체를 수집하여 정보트러스트센터에 기부
30
해외의 디지털유산 보존활동• PANDORA
http://pandora.nla.gov.au– 성격
• National Library of Australia 의 주도 아래 납본권한을 가진 주립도서관 등 9 개 기관이 참여하는 협력사업
• 호주의 온라인출판물의 장기보존과 활용을 목적으로 1996 년부터 시작
31
해외의 디지털유산 보존활동• PANDORA
– 선택과 수집• 호주에 관련된 인터넷 출판물로서 권위와 장기적
가치가 인정되며 오직 온라인 형태만 존재하는 것• 참여기관마다 자관의 선택지침에 따라 선정 • 선정된 웹 사이트는 저작권자의 동의를 얻은 후
수집• 수집로봇 (HTTrack + Teleport Pro) 에 의한 수집과
CD-ROM, FTP, E-mail 을 활용한 출판자의 제출 • 대개 정기적 capture 를 통해 업데이트
32
해외의 디지털유산보존 활동• PANDORA
– 저장과 장기보존• PANDAS(PANDORA Digital Archiving System)
– NLA 가 자체 개발한 디지털아카이브 관리시스템
• 각 기관은 NLA 의 중앙 아카이브에 원격저장 및 다운로드
• 수집된 웹 자원은 MARC 로 편목하여 국가서지 및 수집기관의 자관 목록에 수록
• 장기보존의 기본지침을 설정하고 다양한 실험과 연구 진행
33
해외의 디지털유산보존 활동 • PANDORA
– 이용• 수집된 웹 자원은 대부분 인터넷 상에서
자유로운 접근 가능• 일부 상업출판물은 출판자가 지정한 기간 동안
수집기관의 열람실에서만 이용 가능• 메뉴방식에 의한 주제별 브라우징과 키워드 검색이 모두 가능
34
해외의 디지털유산보존 활동• Kulturarw3
– http://www.kb.se/kw3/– 성격
• 1996 년부터 스웨덴국가도서관 (KB) 이 스웨덴온라인출판물의 수집 , 보존 , 접근 , 활용방법 모색을 목적으로 수행– 선택과 수집
• 스웨덴 전자문헌의 포괄적 수집• 수집로봇 (Combine) 에 의한 대량수집
35
해외의 디지털유산보존활동• Kulturarw3
– 저장과 장기보존• 수집된 파일은 마그네틱테이프와 디스크에
고정하여 서버에 저장• 마이그레이션과 에뮬레이션을 혼용한다는
기본입장을 가지고 관련 실험과 평가 계속 중– 이용
• 2003 년 6 월부터 법에 의해 일반인에게 이용 제공• KB 내의 터미널에서만 접근 가능
36
해외의 디지털유산보존활동• Internet Archive
– http://www.archive.org– 성격
• B. Kahle 의 주도로 1996 년 설립된 미국 샌프란시스코에 위치한 비영리단체
• 디지털형태로 존재하는 역사적 정보자원에 영구적으로 접근할 수 있는 인터넷도서관 구축을 목표로 하는 프로젝트
– 선택과 수집• 수집범위에 제한 없이 세계적 차원에서 광범위한
수집• 자체 개발한 수집용 로봇
37
해외의 디지털유산보존 활동• Internet Archive
– 저장과 장기보존• 분산저장• 마이그레이션과 에뮬레이션
– 이용• 연구자 , 역사가와 학자들을 서비스 대상으로 설정• 누구에게나 무료 접근 허용• Wayback Machine• Recall
38
참고정보원• PADI(Preserving Access to Digital Information)
http://www.nla.gov.au/padi• ERPANET(Electronic Resource Preservation and Acce
ss NETwork) http://www.erpanet.org
• DPC(Digital Preservation Coalition)http://www.dpconline.org
• OCLC(Online Computer Library Center)http://www.oclc.org/digitalpreservation
39
참고정보원• RLG(Research Libraries Group)
http://www.rlg.org/longterm• Digital-Preservation. JISC
http://www.jiscmail.ac.uk/lists/digital-preservation.htmal
• Padiforum-1http://www.nla.gov.au/padi/forum