57
数数数 数数数 数数数数数 数数数数数 数数数 数数国国国国国 国国国国国国国国国国 国国国 国国国国国国国国国国国国国国国国国 书书 国国国国国国国国国国国国国国国国国国国国国国国 国国国国国国国国国国国国国

数字图书馆 的 发展及展望

  • Upload
    kent

  • View
    121

  • Download
    0

Embed Size (px)

DESCRIPTION

数字图书馆 的 发展及展望. 孙承鉴 研究 员 国家数字图书馆工程建设 专家 组组长 国家图书馆二期工程暨国家数字图书馆工程顾问 全国文化信息资源共享工程专家咨询委员会主任委员 中国缩微摄影技术协会理事长. 目录. 一、 数字图书馆概述 二、 国际上数字图书馆的研发情况 三、 我国数字图书馆的研发情况 四、 我国数字图书馆的建设项目 五 、 数字图书馆建设中应注意的几个问题 六、 数字图书馆展望. 一、数字图书馆概述 (一)基本概念. 1、 DL 是复杂的知识系统。 2、 DL 的实现是一个过程。 - PowerPoint PPT Presentation

Citation preview

Page 1: 数字图书馆 的 发展及展望

数字图书馆数字图书馆的的发展及展望发展及展望

孙承鉴研究员

国家数字图书馆工程建设专家组组长国家图书馆二期工程暨国家数字图书馆工程顾问

全国文化信息资源共享工程专家咨询委员会主任委员中国缩微摄影技术协会理事长

Page 2: 数字图书馆 的 发展及展望

目录目录 一、数字图书馆概述

二、国际上数字图书馆的研发情况

三、我国数字图书馆的研发情况

四、我国数字图书馆的建设项目

五、数字图书馆建设中应注意的几个问题

六、数字图书馆展望.

Page 3: 数字图书馆 的 发展及展望

一、数字图书馆概述一、数字图书馆概述(一)基本概念(一)基本概念

1、 DL 是复杂的知识系统。2、 DL 的实现是一个过程。3、 DL 是超大规模的、便于使用的、没有时空限制的知识中心。

Page 4: 数字图书馆 的 发展及展望

数字图书馆,是面向未来互联网发展的信息管理模式。以数字资源的制作、存储、管理、传输和服务为主要特征的数字图书馆技术,是 21 世纪国际科技文化竞争的焦点之一。

Page 5: 数字图书馆 的 发展及展望

数字图书馆涵盖多个分布式、超大规模、可互操作的异构多媒体资源库群,面向社会公众提供全方位的知识服务。可以说,数字图书馆将实现对人类知识的普遍存取,并最终消除人们在信息获取方面的不平等。它既是知识网络,又是知识中心,同时也是一套完整的知识定位系统。

Page 6: 数字图书馆 的 发展及展望

(二)数字图书馆的发展背景 NII( 国家信息基础设施 ) 建设急需大规 模有严密组织的信息资源库 因特网用户急需高效能信 息检索系统 走向知识经济的社会需要面向对象 的知识网络给以支持

Page 7: 数字图书馆 的 发展及展望

(三)数字图书馆的主要特征 数字图书馆是信息基础设施。 数字图书馆是创新型信息资源的建设

服务环境 。 数字图书馆建设的核心是网络知识内

容的组织。 数字图书馆是实现跨库查询的知识中

心。

Page 8: 数字图书馆 的 发展及展望

(( 四四 )) 数字图书馆系统数字图书馆系统示意图示意图

存储与调度库

数字资源管理体系

用户信息服务体系

数字资源建设体系

存储与调度库

数字资源管理体系

用户信息服务体系

数字资源建设体系

Page 9: 数字图书馆 的 发展及展望

(( 五五 )) 数字图书馆体系结构数字图书馆体系结构

Page 10: 数字图书馆 的 发展及展望

二、国际上数字图书馆的二、国际上数字图书馆的 研发情况 研发情况

G8G8 全球信息社会项目全球信息社会项目

美、法、日、英、加、德、意、俄等 国, 其内含各国文化历史精华等内容。

Page 11: 数字图书馆 的 发展及展望

  

 G8G8 全球信息社会项目全球信息社会项目

“ 美国记忆”(美国国会图书馆) “数字图书馆规划”(英国国家图书馆) “德国图书馆”(德国国家图书馆) “ Gallica” (法国国家图书馆) “加拿大数字化规划”(加拿大国家图书馆) “日本国会图书馆电子图书馆初步设计”(日本国会图书馆) “西班牙记忆”(西班牙国家图书馆) “世界记忆”(捷克共和国国家图书馆) “ 1997~ 2000 政策计划”(荷兰王国国家图书馆) “人民之间的交流”(各国)

Page 12: 数字图书馆 的 发展及展望

美国数字图书馆的发展美国数字图书馆的发展

美国数字图书馆始于美国数字图书馆始于 19931993 年,后纳入年,后纳入国家信息基础设施(国家信息基础设施( NIINII )计划中,由白)计划中,由白宫总统信息基础设施特别工作组和竞争政宫总统信息基础设施特别工作组和竞争政务会主持。务会主持。

Page 13: 数字图书馆 的 发展及展望

美国政府“ 国家计算、信息、通信指导办公室” (NCO for CIC),自1994年以来每年发表一本“ 蓝皮书” ,这是一种重要研究与发展的正式官方报告,在这些报告中数字图书馆项目的战略重要性越来越明显。例如:在1995年的蓝皮书“ 用于国家信息基础设施的技术” 中,第2.6节中列出的国家级挑战项目共九项,依次为:

“ 数字图书馆是无墙的知识中心的基础”

“ 这些技术也被用于所有其它的国家级挑战应用之中”

数字图书馆危机及应急管理教育及终身学习电子商务能源管理环境控制和废品最小化保健加工处理和产品公众存取政府信息

数字图书馆危机及应急管理教育及终身学习电子商务能源管理环境控制和废品最小化保健加工处理和产品公众存取政府信息

Page 14: 数字图书馆 的 发展及展望

在1996年蓝皮书“ 高性能计算和通信:用于未来美国信息的基础” 中介绍了18个在美国进行的数字图书馆项目及IP地址。在1997年蓝皮书“ 推进信息技术的前沿” 中明确

将数字图书馆列入生效技术之中。在1998年蓝皮书“ 用于21世纪的技术” 中将数字

图书馆在CIC(计算、信息、通信)的6个研究发展重点项目中又是列于第一位。

特别引人注意的是:美国国家科学基金会在1997年启动“ 知识联网”项目的三次会议上都给出了名为“ 知识联网”的同一份正式的白皮书,其中有这样一张图:

特别引人注意的是:美国国家科学基金会在1997年启动“ 知识联网”项目的三次会议上都给出了名为“ 知识联网”的同一份正式的白皮书,其中有这样一张图:

Page 15: 数字图书馆 的 发展及展望

综 合数字图书馆

Tiny (小型)

Moderate ( 中型)

Immense ( 巨型)

Content Scale(内容规模)

Distribution( 地域范围)

Wide Area( 广域 )

Regional( 区域)

(本地)Local

Hours/Days(数时 / 数天)

Months/Years(数月 / 数年)

Decades/Centuries(数十年 / 数世纪)

GeneralDigitalLibrary

GlobalDesignDecisionNetwork

LocalDesignDecisionNetwork

CrisisManagementKnowledge Network

应急管理知识网络

全 球决策网络

本 地决策网络

Lifetime(生命周期)

美国 NFS(国家科学基金会)关于知识联网的白皮书附图美国 NFS(国家科学基金会)关于知识联网的白皮书附图

Page 16: 数字图书馆 的 发展及展望

1999 年致总统的报告(信息技术研究:投资于我们的未来)中提出二十一世纪美国信息技术的研究与开发的四项重点 , 其中在“软件研究”及 “可扩展的信息基础设施” 中均专门提出建设数字图书馆。 2001 年致总统的报告 [ 数字图书馆:对人类知识进行普遍存取 ] 中指出:数字图书馆提供的是创新型资源和服务。认为联邦政府应在创建和组织数字图书馆中包括支持相关的研究、建立大型数字图书馆试验平台、提供(政府具有的)必要的资源、以及在公正处理数字时代的知识产权起到领导作用。

PITAC

Page 17: 数字图书馆 的 发展及展望

NSF/DARPA/NASA/

联合发出

DLI-1 倡议D.L 先导研究计划一期工程

(1994—1998)

Page 18: 数字图书馆 的 发展及展望

D.L 先导研究计划一期工程参加单位

DLI-1 投资 2400 万美元

1. 《信息媒体 : 综合声音、图象和语言理解 卡内基 · 梅隆大学 技术于数字式视听图书馆的创建和探索》

2. 《环境科学电子图书馆 : 一个可放大的、

智能化的、分布式电子图书馆原型》 加州大学伯克利分校

3 . 《密歇根大学数字式图书馆研究 》 密歇根大学

4. 《亚历山大工程 : 建立具有图象和 加州大学圣 · 巴巴拉分校 空间参照信息的综合性服务功能 的分布式数字式图书馆》

5. 《斯坦福集成数字式图书馆项目 》 斯坦福大学

6. 《构造互联空间 : 为大学的工程学科建立数字图书馆基础设施 》 伊利诺依大学

Page 19: 数字图书馆 的 发展及展望
Page 20: 数字图书馆 的 发展及展望

NSF/DARPA/NLM/LC/NASA/

NEH 联合发出DLI-2 倡议

D.L 先导研究计划二期工程

(1999—2004)

投资 6000 万美元 目标 : 在发展下一代数字图书馆的研 究基础上居领导地位 ;

推进全球分布的网络信息资源的使用;

激励创新应用领域。

Page 21: 数字图书馆 的 发展及展望
Page 22: 数字图书馆 的 发展及展望

美国记忆记忆 (America Memory)(America Memory)

数字图书馆项目 美国国会图书馆等 16 个图书馆、档案馆参与,主要是将美国图书、手稿、音乐、照片、影像等历史资料,计500万件文献经过编辑转化为数字化格式。

1995年启动 2000年完成,总投资投资 60006000万美元。万美元。

目前已有目前已有 8080 个历史资源库上因特网服务,集中反映个历史资源库上因特网服务,集中反映了美国了美国 200200年来的历史文化遗产。年来的历史文化遗产。

Page 23: 数字图书馆 的 发展及展望

美国在研究方面提出

1. 以人为中心的研究:软件工具、智能用户界面、经济和社会影响等。

2. 以内容和藏品为基础的研究:数据、元数据、可互操作性、交互存取等。

3. 以系统为中心的研究:体系结构、组件与集成技术、智能代理、评估等。

Page 24: 数字图书馆 的 发展及展望

当前美国在数字图书馆

发展上的一些特点

1 ,数字资源永久保存的技术、标准、规范成为美国研究的主要方向与趋势之一。 2 , OAIS( 开放档案信息系统 )将成为主要遵循的标准。 3 ,门户与多导引系统成为数字资源服务的关键之一。 4 ,数字挖掘技术将针对非结构化的文档。 5 ,开放源代码将成为二次开发的主要基础。

数字图书馆在美国已经从研究进入到了实施阶段,近几年来尤其是在图书馆的应用得到了很大的发展,并开始出现国家层面的大型数字图书馆应用项目(如 NDIIPP“国家数字信息基础设施和长期保存计划” )。

Page 25: 数字图书馆 的 发展及展望

三、我国数字图书馆的三、我国数字图书馆的研发情况研发情况

Page 26: 数字图书馆 的 发展及展望

中国试验型数字式图书馆项目中国试验型数字式图书馆项目

1997 年立项,国家重点科技项目。由国图和六省市图书馆合作于 2001年 5月完成。

该项目设计开发了通用套装的数字图书馆系统以及数字资源加工系统 , 建立了跨地域多馆合作的网络资源建设体系。

鉴定委员会认为该项目在我国创建了一个分布式、可扩展、可互操作的具有一定资源规模的试验型数字图书馆。达到国内领先国际同类技术水平。

Page 27: 数字图书馆 的 发展及展望

数字图书馆分布式检索数字图书馆分布式检索

叶剑英

Page 28: 数字图书馆 的 发展及展望

知识网络——知识网络——数字图书馆系统工程项目数字图书馆系统工程项目

1998 年国家 863 项目。由国家图书馆与中科院计算机研究所合作完成。 2001年 3月,通过专家组验收。

该系统是在因特网环境下,其体系结构包含多个分布式数字资源库。系统集成代理技术,实现横跨多个资源库快速查询检索。数字资源库建设符合国际数字图书馆研究和实践的相关规范,为在广域网上建设我国数字图书馆群提供一种有效的实施方案。

Page 29: 数字图书馆 的 发展及展望

中关村科技园区中关村科技园区数字图书馆群软课题研究数字图书馆群软课题研究

1999 年 6月,国家图书馆牵头,与北大图书馆、清华图书馆、中科院文献情报中心、国防大学图书馆和首都图书馆等联合进行。

完成了中关村科技园区数字图书馆群的结构框架,制订出中关村科技园区数字图书馆群的实施方案,编篡了一册论文集。

该项目于 2000 年 12月通过专家组验收。

Page 30: 数字图书馆 的 发展及展望

数字图书馆标准规范研究 数字图书馆标准规范研究

2002年由国家科技图书文献中心、科学院图书馆、国家图书馆、 CALIS 管理中心等十四家文献信息机构共同参与的科技部科技基础性工作专项资金重点项目《我国数字图书馆标准规范建设》( CDLS),在数字图书馆标准规范研究方面已经取得了阶段性结果。这些成果对于全国数字图书馆建设具有重要的指导意义。

共有 10个子项目。 网址 http://cdls.nstl.gov.cn/cdls2/w3c/

Page 31: 数字图书馆 的 发展及展望

数字图书馆发展研究 数字图书馆发展研究

2002年 7月由国家计委社会发展司牵头,组织国家图书馆、科学院图书馆、 CALIS 管理中心、社科院图书馆、中央党校图书馆、国防大学图书馆等单位联合。目标是研究数字图书馆发展的现状及其趋势,并制定发展规划的指导性原则,避免重复建设。

该项目于 2004年已基本完成。

Page 32: 数字图书馆 的 发展及展望

四、我国数字图书馆的建设项目四、我国数字图书馆的建设项目

(一)国家数字图书馆工程(一)国家数字图书馆工程 (( 中国数字图书馆工程中国数字图书馆工程 ))

1998年 7 月,国家图书馆向文化部提出申请, 建议在国家立项实施“中国数字图书馆工程”。

Page 33: 数字图书馆 的 发展及展望

文化部于 2000年向国家计委提交了《国家图书馆二期工程暨中国数字图书馆工程项目》立项建议书。

2001年 10 月 31日,“国家图书馆二期工程暨国家数字图书馆基础工程”经国务院正式批准立项。

Page 34: 数字图书馆 的 发展及展望

2002 年 12 月 25 日“国家图书馆二期工程暨国家数字图书馆基础工程”可行性研究报告经国务院正式批准。

工程总建筑面积 77,687 平方米 ,其中:国家图书馆二期工程为 64,766 平方米,国家数字图书馆工程为 12,921 平方米。工程总投资预计 123,500万元。

Page 35: 数字图书馆 的 发展及展望

2004年 11月,国家图书馆二期工程初步设计经发改委批准, 12月破土动工。 2005年 3 月,委托招标代理机构选聘了世源科技工程有限公司(中国电子工程设计院)承担国家数字图书馆工程的初步设计工作。 《国家数字图书馆工程初步设计》于2005年 7 月 1 日由国家项目评估中心召开专家论证会。 2005年 10月 17日国家发改委批准实施。

Page 36: 数字图书馆 的 发展及展望

(二)国家科学数字图书馆工程(二)国家科学数字图书馆工程

该工程于 2001年 12月启动。 国家科学数字图书馆工程是中科院知识创新工程的重要组成部分和科技现代化的支撑体系,它以数字图书馆机制有效地支持科学研究和知识服务,将于 2006 年完成。 中国科学院投资 1.4 亿元人民币。

Page 37: 数字图书馆 的 发展及展望

(三)(三)中国高等教育文献保障体系( 中国高等教育文献保障体系( CALISCALIS))

CALIS 是国务院批准的 211 工程总体建设规划中的两个公共服务体系之一。在九五期间,建成了以 CERNET 为依托的网上信息资源共享系统,有 61 所大学参与。

在十五期间,它的目标是建立中国高等教育数字图书馆。有 100 多所大学参与。

国家投资 1.5 亿元人民币。

Page 38: 数字图书馆 的 发展及展望

(四)(四)中共中央党校数字图书馆工程中共中央党校数字图书馆工程 ..

已酝酿多年,计划用 5 年时间完成。

其结构为: 面向社会的中心网站和若干特色子网站; 分为内部网和外部网; 内网是党校的工作网,外网是对外联系、宣传的窗口。 项目结束时,建设中文数字资源库总容量 10至 15TB

2004可行性研究论证经费约 2.5亿人民币 , 其中数字图书馆部分约 1.5亿人民币。

Page 39: 数字图书馆 的 发展及展望

1 、基础环境和设施必须具备:不能盲目上马 ;

2 、数字图书馆建设是长期任务:不能急于求 成; 3 、一定时期要有有限的实现目标:要有务实 精神。

五、数字图书馆建设中应注意的五、数字图书馆建设中应注意的几个问题几个问题

(一)统筹规划,分步实施(一)统筹规划,分步实施

Page 40: 数字图书馆 的 发展及展望

(二)资源建设是核心(二)资源建设是核心

资源来源有多种渠道、多种介质、多种媒体;强调资源的重组和整合。

资源加工、组织应严格按数字图书馆的规范格式,以免造成不可共享。

资源是分布式的,强调边建设,边服务。

Page 41: 数字图书馆 的 发展及展望

(三)采用先进、实用的技术支持(三)采用先进、实用的技术支持

1. 自动标引,自动文摘生成,自动篇名生成技术。

2. 工业化的 OCR 技术。3. 压缩、解压缩技术。4. 分布式、网络环境下的高效调度系统。

Page 42: 数字图书馆 的 发展及展望

5. 音频、视频网络流式推送、传输、播放软件及其实用的加工生产系统。

6. 多语言技术。7. 以人工智能技术为基础的知识挖掘、基于内容的图像及视频检索技术。

8. 支持 SGML/XML 的搜索引擎等。

Page 43: 数字图书馆 的 发展及展望

(四)标准规范先行

(五)重视解决知识产权问题

(六)加强协调管理,避免重复浪费

→返回主目录

Page 44: 数字图书馆 的 发展及展望

六、数字图书馆展望六、数字图书馆展望

近几年科学技术新的发展以及若干工程近几年科学技术新的发展以及若干工程项目的启动,为数字图书馆实施创造了有利项目的启动,为数字图书馆实施创造了有利的条件。的条件。 以下仅举例说明。以下仅举例说明。

Page 45: 数字图书馆 的 发展及展望

(( 一一 )) 数字图书馆标准规范建设数字图书馆标准规范建设有了新的进展有了新的进展

《我国数字图书馆标准规范建设》(CDLS),2004年 9 月已完成并发布了89份研究报告。这些成果对于全国数字图书馆建设具有重要的指导意义。 OAIS(开放档案信息系统 )成为主要遵循的标准。 数字资源永久保存的技术、标准、规范成为研究的主要方向与趋势之一。

Page 46: 数字图书馆 的 发展及展望

(( 二二 )) 数字版权管理(数字版权管理( DRMDRM )技术在发)技术在发展展

为介决知识产权提供了技术手段为介决知识产权提供了技术手段

数字版权管理( DRM )提供了关于版权保护和数字媒体内容的传输、管理和发行的一套解决方案,主要是保护数字媒体内容免受未经授权的播放和复制的方法。

数字水印、密钥技术等也有了很大的发展。 国内有不少单位在研制开发 DRM 系统。

Page 47: 数字图书馆 的 发展及展望

(三)(三) IPv6IPv6 协议的应用,为协议的应用,为 IPIP 地址的地址的无限扩充开辟了道路无限扩充开辟了道路

目前的 Internet 网络是基于 IPv4技术。

IPv4 产生于 1974年,最早用于科学研究和教育领域,方便技术人员之间实现文件共享和一些简单的通信功能,因而 IPv4 协议并没有考虑作为电信级网络支撑协议所必须具备的一些特性,存在着设计缺陷。

网上信息服务工作面临 IP 地址严重缺乏的问题。

Page 48: 数字图书馆 的 发展及展望

IPv6 继承了 IPv4 的端到端的基本思想和简单、高效、开放的特点,同时具有几乎无限的地址容量,支持规模更大的网络结构,改进了安全性和数据的完整性,具有自动配置、移动计算、数据组播和更有效的网络路由聚合等优点,是下一代网络的理想协议。

在各国厂商的共同努力下,从 IPv4到IPv6 的转换在技术上已不是难题。

因此采用下一代互联网 IPv6 技术具有很大的现实意义。

Page 49: 数字图书馆 的 发展及展望

(四)网格技术的发展为资源共 享(四)网格技术的发展为资源共 享扩展了领域扩展了领域

信息资源服务系统中一个非常重要的理念就是信息资源的共建共享,而网格技术则利用高速因特网把分布于不同地理位置的计算机、数据库、存储器和软件等资源连成整体,就像一台超级计算机一样为用户提供一体化信息服务,其核心思想是“整个因特网就是一台计算机”,这与共建共享的理念不谋而合。

Page 50: 数字图书馆 的 发展及展望

电力网格电力网格

称电力网为 Power Grid,指本地与远处许多发电厂组网,为许许多多的用户提供 pervasive (普及的、遍布的、扩大的 ) 服务。

Pervasive 服务,指用户通过任意一个通用的插头,就可以按需获取电力,而不用操心功率耒自哪一个发电厂。

电力网是一种 pervasive/grid 型的并行共享结构。

Page 51: 数字图书馆 的 发展及展望

计算网格计算网格

利用互联网把分散在不同地理位置的计算机组成计算网格( computing grid),并按电力网 pervasive/grid 模式工作,实现计算能力的广泛共享。通过一个接口,网格上的用户就可能拥有高性能的计算能力,而不用过问强大的计算能力是网上的哪些计算机提供的。

2000年以耒,国内外巳投入大量资金从事计算网格研究,并巳获得喜人的成果。

Page 52: 数字图书馆 的 发展及展望

信息网格信息网格

万维网(简称 Web)也是一种大量信息资源向大量用户提供按需服务的“多对多”体系,但运作却是“一对一”的 client/server模式,用户需要直接面对数不清的“信息弧岛”。

希望 Web改变成“后 web”或“信息网格”,用户看到的不再是一个个门类繁多的网站,而是单个普适的入口或单一的系统映象。

为此,信息资源需整合形成一体化的平台,并改用 pervasive/grid 模式工作。

Page 53: 数字图书馆 的 发展及展望

网格技术一方面具有成本低、效率高、使用更加方便等优点;另一方面具有较为统一的国际标准,有利于整合现有资源,也易于维护和升级换代。

可以予见,网格技术将为数字图书馆的发展提供方便、快速、准确的服务环境。

Page 54: 数字图书馆 的 发展及展望

(五)汉字全字符集码位空间已(五)汉字全字符集码位空间已完全解决完全解决

现有国际标准 ISO/ICE 10646 2003 , 等同的工业标准是 Unicode 4.0 。基本集20902 个汉字;扩 -A集 6582 个汉字;扩 -B集 42711 个汉字;总计已有 70,000余汉字。现在正在讨论增加扩 -C 子集。

Page 55: 数字图书馆 的 发展及展望

目前,国家语委正在收集 7 万至 10万汉字的字符集,讨论增加扩 -C 子集中的内容。将向 ISO申请码位空间。

由于汉字字码已不再受字符平面空间的限制,因此,汉字字符的字码源源无限。这将为数字图书馆使用汉字字符提供了极大的方便。

Page 56: 数字图书馆 的 发展及展望

结束语结束语

我们已经跨入二十一世纪,新世纪将是一个更加美好的时代。而新世纪对我们图书情报工作者而言,任务将更加艰巨,责任更加繁重,使命更加重大。 我们只有抓紧时间建设数字图书馆才能高效率地完成工作,通过互联网络,向全世界展示我国悠久的历史、灿烂的文化以及繁荣昌盛的国力,以不辱我们这一代图书情报工作者的历史使命。

Page 57: 数字图书馆 的 发展及展望

谢 谢 谢 谢 !!

电邮电邮 : : [email protected]@nlc.gov.cn电话电话 : 010-68482788: 010-68482788 010-88545081 010-88545081