29
檔檔檔檔檔檔檔 103 保保保保保保保 Preservation Metadata 檔檔檔檔檔 檔檔檔 2014/11/27 [email protected]

20141017 布丁 chpater 12. 保存性後設資料

Embed Size (px)

Citation preview

Page 1: 20141017 布丁   chpater 12. 保存性後設資料

檔案編排與描述 103 年 保存性後設資料

Preservation Metadata

政大圖檔所 陳勇汀2014/11/27

[email protected]

Page 2: 20141017 布丁   chpater 12. 保存性後設資料

參考書目Day, M. (2004).

Chapter 12. Preservation metadata.

In G. E. Gorman & D. G. Dorner (Eds.), Metadata applications and management (pp. 253-273). London: Facet Publishing.

2

Page 3: 20141017 布丁   chpater 12. 保存性後設資料

保存性後設資料• Cunningham (2009) 的定義:• 「保存用後設資料是一種結構化的資訊,用來描述或允許我們在不同時空背景下皆可以找到 (find) 、管理 (manage) 、控制 (control) 、理解

(understand) 或保存其他資訊。」

3

保存 (preservation)是一些後設資料 (metadata)的整合

Page 4: 20141017 布丁   chpater 12. 保存性後設資料

ABSTRACT• 本章介紹目前提出的數位保存策略,說明後設資料在保存中扮演的重要角色。• 本章將介紹 OAIS 參考模型以及相關的計畫。• 最後則是討論數位保存目前的問題

4

Page 5: 20141017 布丁   chpater 12. 保存性後設資料

OUTLINE1. 保存策略與後設資料2. OAIS 參考模型3. 相關計劃4. 長期保存的議題

5

Page 6: 20141017 布丁   chpater 12. 保存性後設資料

保存策略與後設資料PART 1

6

Page 7: 20141017 布丁   chpater 12. 保存性後設資料

保存策略 (1/2)• 保存技術 (Preserving Technology)

• 完整保存硬體與作業系統的整體• 因此可以用原始的硬體與軟體環境來讀取資料

• 模擬 (Emulation)• 開發一個模擬程式,可以在新平臺上模擬舊平臺的硬體與作業系統的行為• 這是現在最受關注的策略

7

書本頁碼: 484

Page 8: 20141017 布丁   chpater 12. 保存性後設資料

保存策略 (2/2)• 轉置 (Migration)

• 定期地將電腦的資訊技術轉移到下一代的平臺• 這是目前最多人使用的策略,通常會搭配其他標準,例如

• 封裝 (Encapsulation)• 讓被典藏的物件能夠自我描述 (self-describing)• 資訊內容將會連同解讀它所需要的資訊一併被封裝。• 這是 OAIS 參考模型的基本概念,也是統一保存格式

(Universal Preservation Format) 與維多利亞電子文件保存策略 (Victorian Electronic Records Strategy) 的原理。• 封裝也能用於其他策略上,包含模擬與轉置。

8

書本頁碼: 485

Page 9: 20141017 布丁   chpater 12. 保存性後設資料

保存用後設資料的角色• 保存用後設資料泛指多種資料類型,即使是歷經千秋萬世,也可以重新建立與解釋數位資訊的結構與內容• Lynch (1999) :後設資料建立每一個數位物件之間的關聯脈絡、並提供相關的敘述

(descriptive) 、結構 (structural) 、管理(administrative) 、權限管理 (rights management) 以及其他資訊

• 訂定保存用後設資料並不容易,現今標準不是非常複雜,就是只定義基本框架 (framework)• 未來將繼續探討不同類型的後設資料所支援的數位保存策略或是數位資訊類型

9

數位化保存策略保存用後設資料

書本頁碼: 485

Page 10: 20141017 布丁   chpater 12. 保存性後設資料

OAIS參考模型

10

PART 2

書本頁碼: 486

Page 11: 20141017 布丁   chpater 12. 保存性後設資料

OAIS 參考模型介紹• OAIS 參考模型目的是為了提供高層次的框架,以發展並比較數位典藏

• 其定義是為了人與系統的組織,負責保存資訊並讓其可用於特定社群。• 這是由 ISO 計劃中的太空資料系統諮詢委員會

(Consultative Committee on Space Data Systems, CCSDS) 發展的標準,用以支援長期衛星資料的保存。

• 但現今則是轉變成一般化的模型,可用於各種典藏情境(preservation context) 。

11Reference Model for Open Archival Information System

書本頁碼: 486

Page 12: 20141017 布丁   chpater 12. 保存性後設資料

OAIS 模型 12

OAIS 參考模型功能模型 資訊模型

內容資訊 保存描述資訊 封裝資訊 描述資訊

參考資訊 脈絡資訊 保存資訊 固定性資訊模型

書本頁碼: 486

Page 13: 20141017 布丁   chpater 12. 保存性後設資料

OAIS 模型定義OAIS Functional Entities 功能模型• 功能模型勾勒出現今館藏庫應有的功能,並且定義更多 OAIS規格中的細節

• 取用 (access) 、• 管理 (administration) 、• 館藏儲存 (archival storage) 、• 資料管理 (data

management) 、• 匯入 (ingest)• 保存計劃 (preservation

planning)

Information Model資訊模型• 資訊模型定義了各種保存與取用所需要的資訊類型

( 或是說,後設資料 ) 。

13

書本頁碼: 486

Page 14: 20141017 布丁   chpater 12. 保存性後設資料

功能面定義 14

書本頁碼: 487

Page 15: 20141017 布丁   chpater 12. 保存性後設資料

資訊物件 (1/2)

• 內容資訊 (Content Information)• 內容資訊是指保存所需的資訊

• 保存描述資訊 (Preservation Description Information, PDI)

• PDI 是指為了能夠在歷經長期時間之後能夠理解內容資訊所必需相關資訊• 封裝資訊 (Packaging Information)

• 包含媒體規格的資訊• 描述資訊 (Descriptive Information)

• 協助使用者針對找尋與取用他們感興趣的資料

15

書本頁碼: 487

Page 16: 20141017 布丁   chpater 12. 保存性後設資料

資訊物件之 PDI 分類• 指引資訊 (reference information) :

• 任何可以協助描述內容資訊的資訊。• 特別可以從描述資訊中抽取出包含用於辨識典藏庫中的內容資料。

• 脈絡資料 (context) :• 脈絡 (context)應該包含在數位環境下的脈絡資訊,包含內容資訊是為何產生、它跟其他的數位物件之間的關係。• 有部分的脈絡資訊被分配到封裝資訊中。

• 保存資訊 (Provenance Information) :• 描述內容資訊的版本歷史資訊。• 一般包含來源、變更 ( 例如轉置 ) 以及記錄保管的歷史資料。

• 固定性資訊 (Fixity Information) :• 記錄文件的授權控管資訊。

16

書本頁碼: 488

Page 17: 20141017 布丁   chpater 12. 保存性後設資料

Information Package資訊封裝• OAIS 模型定義了一種資訊封裝的概念性模型

• 將內容資訊及其相關的 PDI 與數位資料物件• 資訊封裝包括了

• 遞交用 (submission, SIP) 、• 典藏用 (archival storage, AIP) 、• 傳播用 (dissemination, DIP)

• 其中典藏用資訊封裝是最重要的數位保存資訊,它包含了所有長期保存所需要的資訊

17

書本頁碼: 489

Page 18: 20141017 布丁   chpater 12. 保存性後設資料

相關計劃18

PART 3

書本頁碼: 489

Page 19: 20141017 布丁   chpater 12. 保存性後設資料

相關計劃1. 國家與研究圖書館2. 數位化計劃3. 公文檔案文件記錄的後設資料

19

書本頁碼: 489

Page 20: 20141017 布丁   chpater 12. 保存性後設資料

國家與研究圖書館 1/2• NLA (National Library of Australia) :從 1990 年代發展的館藏與澳洲出版數位化內容的保存實務作法• Cedars (CURL Exemplars in Digital Archives) :英國的保存性後設資料計劃• NEDLIB (Networked European Deposit Library) :歐洲基於 OAIS 模型的數位圖書館典藏系統

(deposit system for electronic libraries, DSEP) ,並制訂了最小化的必備保存性後設資料

20

書本頁碼: 490

Page 21: 20141017 布丁   chpater 12. 保存性後設資料

國家與研究圖書館 2/2• OCLC/RLG (OCLC Online Computer Library

Center/Research Libraries Group) : OCLC線上電腦圖書館中心以及研究圖書館團隊提出了一套後設資料架構,可用於內容資訊 (Content Information) 與保存性描述資訊 (PDI)

• NLNZ :紐西蘭國家圖書館在 2002 年發表了他們自己的保存性後設資料規格,用以管理物件本身、處理程序、各別檔案、以及管理性後設資料

21

書本頁碼: 490

Page 22: 20141017 布丁   chpater 12. 保存性後設資料

國家與研究圖書館OCLC/RLG

22

書本頁碼: 492

• "A Metadata Framework to Support the Preservation of Digital Objects" (2002)

• 支援數位物件保存的後設資料框架• OCLC/RLG 後設資料規格採用了 OAIS 資訊模型作為框架

• 內容資訊:需要包含內容資料物件 (Content Data Object) 或著說是串流檔案 (bit streams) ,以及呈現資訊 (Representation Information) ,包含物件本身以及它的軟硬體環境。

• PDI :建議參考 OAIS 的指引、脈絡、保存與固定性表頭資訊。• 保存性資訊:應以事件為單位的架構,定義處理流程的普遍元素,像是匯入時的轉換、格式轉置等等。

Page 23: 20141017 布丁   chpater 12. 保存性後設資料

數位化計劃• METS (Metadata Encoding and Transmission Standard) :以 XML 格式來協助數位圖書館物件的管理與交換

• 「描述性後設資料」 (descriptive metadata) 、• 「管理性後設資料」 (administrative metadata) 、• 「檔案群」 (file groups) 以及• 「結構地圖」 (structural maps)

• NISO (National Information Standards Organization)草稿標準:是從 " 數位靜態圖像的技術性後設資料 "規格制訂,主要是用於定義記錄數位圖像的記錄細節以及產生數位圖像的相關技術。• MIX :由美國國會圖書館的網路發展與 MARC 標準辦公室發展的 XML規格,用於非特定對象

23

書本頁碼: 493

Page 24: 20141017 布丁   chpater 12. 保存性後設資料

公文檔案的後設資料• 公文檔案著重於文件 (records)

• 作為證據用的資訊創造、接受以及管理,以及由組織或個人用於法律權利與商業交易的資訊• BAC Model (Business Acceptable Communications) 是由美國匹茲堡計劃 (Functional Requirements for Evidence in Recordkeeping

project, the Pittsburgh Project) ,目的在於提出一套具有「管理層」(handle layer) 的後設資料架構,可以用於在檔案建立時自動化產生連到各別檔案的資訊,也可以描述內容與檔案的情境,以供後續使用。

• 檔案保存後設資料標準 (Recordkeeping Metadata Standard) :參考澳洲國家檔案館NAA 的建議制訂,用於澳洲國家機關• 澳洲檔案保存後設資料標準 (Australian Recordkeeping Metadata

Schema, RKMS) :澳洲Monash 大學發展的檔案後設資料框架,用於在數位化時代中,具體描述與標準化檔案後設資料的範疇。

24

書本頁碼: 495

Page 25: 20141017 布丁   chpater 12. 保存性後設資料

長期保存的議題

25

PART 4

書本頁碼: 496

Page 26: 20141017 布丁   chpater 12. 保存性後設資料

Interoperability互通性•互通性是一種可以在不同典藏庫間簡單地交換保存性後設資料 ( 或是資料封裝 ) 的標準• 目前可能得參考 METS 標準來規劃資料交換格式的基礎• Cedars 與 OCLC/RLG 考量到「既存後設資料」 (existing metadata) :有些保存性後設資料可從既有的後設資料中提取,例如可從

MARC21 與 DC 、權限後設資料取得有效的描述資訊

26

書本頁碼: 497

Page 27: 20141017 布丁   chpater 12. 保存性後設資料

Cost成本1. 最小化重複建檔 (duplication) :有些資訊可從目前典藏庫中已保存的資料取用2. 部分後設資料可以自動產生3. 盡量採用目前最好的數位典藏策略4. 最好縮短匯入到可取用的處理時間 (time

delay) ,不然可能會遺失掉重要資訊

27

建立與維護保存性後設資料的確很昂貴BUT為了建立成功的數位保存,這是必要的花費

書本頁碼: 498

Page 28: 20141017 布丁   chpater 12. 保存性後設資料

Looking to the future未來發展1. 仍然需要更多數位保存策略的實際經驗2. 各種數位保存計劃之間需要更多的合作3. 未來可以針對不同數位保存策略對於使用者的影響進行研究

28

書本頁碼: 499

Page 29: 20141017 布丁   chpater 12. 保存性後設資料

Thank You For Your Attention