42
我我我我我我我我我我我我我 我我我我我 我我 2008 我 11 我

我国高校数字资源长期保存的 挑战与策略

Embed Size (px)

DESCRIPTION

我国高校数字资源长期保存的 挑战与策略. 朱强 2008 年 11 月. 提纲. 引言 高校数字资源建设现状 高校数字资源保存现状 高校数字资源长期保存的策略 结语. 引 言. 我们面临一个全新的数字环境. 无所不在的网络和无所不在的计算 信息化成为国家建设五大战略任务之一 电子商务、电子政务、数字出版、无纸办公 … 数字地球、数字城市、数字社区、数字校园、数字图书馆 … 家电数字化和数字产品家电化(数字家庭). 信息技术促使学术交流体系发生变化. 出版从“分子书”走向“电子书”,使得电子出版、网络出版变得越来越普遍 - PowerPoint PPT Presentation

Citation preview

Page 1: 我国高校数字资源长期保存的 挑战与策略

我国高校数字资源长期保存的挑战与策略

朱强2008 年 11 月

Page 2: 我国高校数字资源长期保存的 挑战与策略

提纲 引言 高校数字资源建设现状 高校数字资源保存现状 高校数字资源长期保存的策略 结语

Page 3: 我国高校数字资源长期保存的 挑战与策略

引 言

Page 4: 我国高校数字资源长期保存的 挑战与策略

我们面临一个全新的数字环境 无所不在的网络和无所不在的计算 信息化成为国家建设五大战略任务之一 电子商务、电子政务、数字出版、无纸办

公… 数字地球、数字城市、数字社区、数字校园、

数字图书馆… 家电数字化和数字产品家电化(数字家庭)

Page 5: 我国高校数字资源长期保存的 挑战与策略

5

信息技术促使学术交流体系发生变化 出版从“分子书”走向“电子书”,使得电子

出版、网络出版变得越来越普遍 刚刚落幕的法兰克福书展上,超过 30% 的展品是数

字化产品 统计显示,我国现有电子图书 50 万种,互联网期刊

9000 种,数字报纸 600 多份。预计未来 5 年,将有 30% 的手机用户通过手机阅读电子书和数字报,由图书馆等机构用户采购的电子书、数字报的销售规模将达到 10 亿元,由网民和手机用户带动的电子书、数字报内容销售及广告收入将达到 50 亿元。

北京大学图书馆

Page 6: 我国高校数字资源长期保存的 挑战与策略

学术交流的渠道增多、范围更广,开放获取运动和机构存储成为网络环境下学术界传播及出版学术信息的一种新的方式 据西安交大图书馆的统计,国外开放获取期刊

已超过 12000 种

北京大学图书馆 6

Page 7: 我国高校数字资源长期保存的 挑战与策略

学习和研究的方式在变化,许多人习惯于用搜索引擎查找资料,对电子书刊的阅读日益增加

中国出版科学研究所有关报告表明:我国国民传统介质阅读率持续 6 年下降的同时,网络阅读率 6 年来则上升了 6.5 倍。今年发布的第五次全国国民阅读调查报告也显示,互联网阅读已达 44.9% ,比 2005年提高了 17.1% ,已经接近了 48.8% 的图书阅读率。

-- 《解放日报》 2008 年 11 月 8 日

7北京大学图书馆

Page 8: 我国高校数字资源长期保存的 挑战与策略

关于未来信息资源获取的预测

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

1999 2002 2005 2007 2010

Services: 1999, 2002, 2005, 2007, 2010

PercentagesDynamic

Digital

Print

Page 9: 我国高校数字资源长期保存的 挑战与策略

美国同行认为,到 2025年,纸本书刊将会从图书馆消失

数字资源越来越多,甚至占据主体地位,应该是趋势

9

Page 10: 我国高校数字资源长期保存的 挑战与策略

已有数字资源类型一览

文献(技术报告、会议论文、预印论文)

图书 学位论文 数据集 计算机程序 视觉、模拟模块 多媒体出版物

电子刊物 书目、目次、摘要 图像 视听资料 格式化数字收藏 电子教学资料 网页 管理资料

Page 11: 我国高校数字资源长期保存的 挑战与策略

图书馆借助于信息技术走向数字化 大量的纸质文献和其他文献被数字化,形成图

书馆的特色资源 超过三分之一的经费被用于购买数字资源或购

买数字资源访问权 互联网上的学术信息被加以组织,形成导航库;

许多网站的信息被有计划地下载,与上述资源共同构成图书馆的数字资源

Page 12: 我国高校数字资源长期保存的 挑战与策略

图书馆实体资源和虚拟资源的结合必然要求加强对数字资源的管理和保存 数字资源的虚拟性 数字资源的多样性 数字资源的脆弱性 数字资源建设和使用的复杂性

Page 13: 我国高校数字资源长期保存的 挑战与策略

高校数字资源建设现状

Page 14: 我国高校数字资源长期保存的 挑战与策略

高校图书馆的数字资源包括 商业化的数字资源(多数为租用,少数为拥

有) 多馆共建的数字资源 单馆自建的数字资源

Page 15: 我国高校数字资源长期保存的 挑战与策略

以北大图书馆为例 各种数字资源学科门类基本齐全,引进的 SCI 、中国期

刊网、 Jstor 、新东方网络课程等国内外数据库已达近500 个

网上全文电子期刊达 45,000 多种,各类电子图书和学位论文等近 50 万册

数字扫描加工的古文献、民国图书、学位论文、教学参考书和民国旧报刊等印刷型资源超过 12TB

拥有近 16TB 的本地数字资源,并且每年以 7-8TB 的速度增长

Page 16: 我国高校数字资源长期保存的 挑战与策略

CALIS 数字资源类型

中 /外文全文电子刊

数据库

中 /外文全文电子教学参考

书库

中 /外文学位论文文摘与全文

数据库

其它的全文数据库、事实数据库、二次文献库

高校中外文书刊联合目录数据库

中外文期刊目次数据库

重点学科网络资源导航

数据库

高校专题特色

资源数据库参考咨询

信息库 数字图书

16

Page 17: 我国高校数字资源长期保存的 挑战与策略

CALIS 数字资源数量

17

Page 18: 我国高校数字资源长期保存的 挑战与策略

CALIS集团引进数据库 目前, CALIS集团共购买数据库 283个,其中文摘索引数据库 126 个,电子期刊数据库 80 个,电子图书数据库 21个,事实型数据库52 个,其它数据库4 个。

Page 19: 我国高校数字资源长期保存的 挑战与策略

其中,全文电子期刊 30,636 种(去重后约24,000 种)

会议录 8,557 种 电子图书(包括学位论文) 145,052 种 平均回溯年限大约 15 年

Page 20: 我国高校数字资源长期保存的 挑战与策略

CALIS 自建特色数字资源( 65 )

中国科技史数字图书馆资料库猪养殖特色数据库铁路交通运输特色数据库湖南人物数据库长江资源库中国年谱数据库跨国公司研究专题数据库上海百个著名作家学术研究资料数据库机器人信息系统河南地方文献数据库华侨华人文献信息专题数据库电子科学与技术重点学科特色库东北亚研究数据库潮汕文献数据库汽车工程信息数据库钱伟长特色网站数据库

高校古文献资源库高校音乐教育资源数据库朱子研究特色农产品加工专题数据库东南亚及闽台研究数据库无人驾驶飞机专题文献数据库红色江西特色数据库《红楼梦》特色数据库大珠三角地区研究文献数据库经济学学科知识门户粮油食品专题特色数据库食品科学与工程专题数据库书院文化数据库猪养殖特色数据库饲料添加剂专题特色库民国时期文献资源库

20

Page 21: 我国高校数字资源长期保存的 挑战与策略

CALIS 自建特色数字资源 (续 )

巴蜀文化特色数据库中国年谱数据库民用航空专题数据库摩托车信息特色资源数据库中国水力发电工程猪养殖特色数据库《江南制造局》专题特色库数据库CAD/CAM专题文献数据库心血管疾病信息资源数据库中国年谱数据库民族相关文献特色库小麦文献信息数据库《北大讲座》视频点播资源库河南地方文献数据库陆相油气勘探开发专题数据库汽车资源数据库邮电通信专题文献数据库

潮汕文献数据库西夏文化数据库系统行为科学专题数据库复合材料专题特色数据库高校音乐教育资源数据库中国民族音乐数据库系统河洛文化文献专题数据库中国农村问题研究文献数据库无人驾驶飞机专题文献数据库北大名师多媒体特藏数据库中国邮政数据库建筑艺术与技术资料库经济学学科知识门户中国建筑文化特色数据库兽药文献信息数据库中国航运信息资源库

21

Page 22: 我国高校数字资源长期保存的 挑战与策略

单馆自建数字资源以北大图书馆为例1) 祕籍琳琅—北京大学图书馆古文献资源库2) 北京历史地理数据库3) 北京大学学位论文数据库4) 北大名师数据库5) 视频点播多媒体数据库6) 热点话题数据库7) 新书导读数据库8) 网上咨询台—常见问题数据库9) 一小时讲座—课件数据库自建数据库数据量已超过 12TB,品种和数量将继续增加

Page 23: 我国高校数字资源长期保存的 挑战与策略

高校数字资源保存现状

Page 24: 我国高校数字资源长期保存的 挑战与策略

目前的模式 引进数字资源的存档

镜像模式 裸数据模式

自建数字资源的存档 备份模式 镜像模式

24

Page 25: 我国高校数字资源长期保存的 挑战与策略

镜像数据库 覆盖年份 镜像数据库 覆盖年份1 CALIS本地服务- Nature 2002年-现在 17 SpringerLink 2003年-现在

2 CALIS本地服务- RSC 2003年-现在 18 INSPEC 2003年-现在

3 CALIS本地服务- IOP 2002年-现在 19 RefWork 2003年-现在

4 CALIS本地服务- Kluwer 2002年- 2005年 20 BioOne 2004年-现在

5 PQDD 2002年-现在 21 SAGE 2005年-现在

6 Beilstein/Gmelin CrossFire 2004年-现在 22 SIAM 2005年-现在

7 Genome Database 2000年-现在 23 ASTM 2005年-现在

8 Science Online 1997年- 2004年 24 DIN 2005年-现在

9 Ei Village 1998年-现在 25 Bowker 2006年-现在

10 CSA 1999年-现在 26 IEE Computer Society 2006年-现在

11 NTIS 1999年-现在 27 Ingenta 2006年-现在

12 SDOS 2000年-现在 28 Micromedex Health Series 2006年-现在

13 Zbl.Math 2002年-现在 29 Nature Series 2005年-现在

14 SpringerLink 2002年-现在 30 CCC 2005年-现在

15 ACM 2002年-现在 31 Emerald 2003年-现在

16 WSN 2002年-现在 32 CRC 2005年-现在25

Page 26: 我国高校数字资源长期保存的 挑战与策略
Page 27: 我国高校数字资源长期保存的 挑战与策略

问题与挑战 总体上缺乏完整的数字资源长期保存政策和

战略规划 引进资源方面,缺乏强制性的有效的措施和

手段 自建资源方面,缺乏政策指导、规划协调和监督检查

技术上,缺乏系统的研究和完善的方案 最根本的,缺乏资金投入

Page 28: 我国高校数字资源长期保存的 挑战与策略

高校数字资源长期保存的策略

Page 29: 我国高校数字资源长期保存的 挑战与策略

关于数字资源长期保存 美国研究图书馆组织( RLG )对“可信赖的数

字仓储”( trusted\reliable digital repository )作了如下定义:“一个可信赖的数字仓储,是以提供对受控数字资源长期存取为使命的仓储;其职责是为了存储者以及当前和将来用户的利益对数字资源进行长期维护;按照普遍接受的惯例和标准设计系统以保证实时管理、存取和存储其中的资料的安全;建立系统评估方法以满足用户对于文档真实性的需求;可以被可靠地用来公开和明确地履行对存储者和用户的长期职责;其政策、运行和表现可以被稽核和测量。”

Page 30: 我国高校数字资源长期保存的 挑战与策略

数字资源保存的目标 数字资源在存储媒体上的可读性 数字字符串可以被人或电脑阅读和处理 格式化内容可以被它的使用者理解 数字资源与它所代表的原体相同(或记载不同

之处)

Page 31: 我国高校数字资源长期保存的 挑战与策略

Rosenthal 等人提出了系统的保存策略:

复制( replication),提供对数字资源的备份; 迁移( migration),将数字资源迁移到新的系统或平

台; 透明( transparency),公开数字资源的编码,以利

于解读和迁移; 多样( diversity),多种格式并存,以便某些格式过

时时,其他格式仍可替代; 稽核( audit),不断对数字资源的状态进行检查,确

保其完好; 经济( economy),确定保存项目的轻重缓急,首先确

保最重要的部分; 怠速( sloth),有意降低系统运行速度,以便在数据

崩溃时增加修复的可能性

Page 32: 我国高校数字资源长期保存的 挑战与策略

保护数字资源的几种做法 载体更新( Refreshing )

Tape->harddisc->CD->DVD, copy without change

原始形态保存( Static Preservation ) Preserve the bits

旧新迁移( Migration ) Periodic transfer of materials from one

hardware/software configuration to another 模仿环境( Emulation)

Provide software tools to emulate or mimic essential viewing applications and operating environments

Page 33: 我国高校数字资源长期保存的 挑战与策略

不同类型数字资源的保存策略 重要商业资源的存档:商业资源的服务一般是有保障

的,对这类资源 CALIS 将和其他共享组织联合起来分工协作保存,并做战略性存档,防止突发的事件和突然的灾害

高校自建资源的存档:这类资源是有组织建设的,目的性强,应在组织大家建设的同时,集中存档。但是这类资源的后续服务中的问题,如版权等,是需要加以考虑和解决的

网上免费资源的存档:选择对重点学科建设有用的资源,整体规划,分工协作

教学科研过程中产生的资源:加强各校的论文、报告、课件等资源的收集、整理和加工

33

Page 34: 我国高校数字资源长期保存的 挑战与策略

原则性考虑 联合其他系统,共同建立安全存储数据的网络,对缺少和没有后继服务的有价值资源进行存档,防止和减少资源的丢失

集中和分布结合,同类资源能集中到一起的,集中保存,并进行异地备份;不适合集中到一起的,分散保存。能提供集中服务的,集中服务;否则,分散服务

鼓励地方增加存档经费,减轻中央投资的压力 为全国和地区中心配备存档设备,由 CALIS核心馆承担存储任务

引进的商业资源保留 1 个备份,自建资源保留 2 个或2 个以上备份

34

Page 35: 我国高校数字资源长期保存的 挑战与策略

数字资源建设应当采取以下策略: 在项目之初就重视有关保存政策的制订; 采用国际标准与通行做法,如 OAIS (Open

Archival Information System); 尽量采用无产权( non-proprietary )系统,以减少来自软件所有者的限制;

建立永久性文档管理措施; 合作建立可靠的数字仓储。

Page 36: 我国高校数字资源长期保存的 挑战与策略

建立统一的长期保存技术平台 建立 Open Access平台 建立统一规划下的机构仓储平台 为其他开放资源提供存取平台 建立数据储存与灾备系统 建立数字资源保存中心

36

Page 37: 我国高校数字资源长期保存的 挑战与策略

关于数字资源保存的国家战略(建议) 立法保障商业化数字资源的长期可获得性

使用权 存档权

重视原生数字资源的采集和保存 必要性 战略与规划 分工与合作

机构仓储 主题仓储

Page 38: 我国高校数字资源长期保存的 挑战与策略

统一规划建立国家级数字资源中心 体制问题:

谁来牵头或协调 资源是集中还是分布

政策问题 国家统一投入还是部门分担 无偿使用还是有偿使用

Page 39: 我国高校数字资源长期保存的 挑战与策略

方案设计考虑因素: 成本和效率 便利性 安全性

Page 40: 我国高校数字资源长期保存的 挑战与策略

结 语

Page 41: 我国高校数字资源长期保存的 挑战与策略

数字时代,必须十分重视信息的长期保存 保存是选择性的,需要对信息加以过滤 图书馆作为保存人类精神产品的社会机构,尤其要重视数字资源的长期保存

我国数字资源的长期保存目前还缺乏系统性的研究和完整、可靠的解决方案

各方面应该重视和研究数字资源的长期保存,高校将积极参与、主动配合

Page 42: 我国高校数字资源长期保存的 挑战与策略

谢 谢!