16
电电电电电电电电电电电电 电电 电电 2009-10-15

电子资源的元数据编目实践

Embed Size (px)

DESCRIPTION

电子资源的元数据编目实践. 黄镝 武汉 , 2009-10-15. 内容提要. 上交大电子资源的种类和数量 上交大电子资源整合和揭示的策略与框架 上交大电子资源编目的现状 元数据编目的优势 元数据字段的自动处理 元数据编目的实例 —PQDT 全文 问题与思考. 上交大电子资源的种类和数量. 电子资源整合与揭示的策略. 方便用户资源发现与使用 提高资源利用效率 满足不同层次用户的需要 多途径、多角度整合揭示 尽可能延伸揭示的广度与深度 统一分类体系. 电子资源整合与揭示框架. 思源探索 -Primo(1). 思源探索 -Primo(2). - PowerPoint PPT Presentation

Citation preview

Page 1: 电子资源的元数据编目实践

电子资源的元数据编目实践

黄镝武汉 , 2009-10-15

Page 2: 电子资源的元数据编目实践

电子资源的元数据编目实践

内容提要

上交大电子资源的种类和数量上交大电子资源整合和揭示的策略与框架上交大电子资源编目的现状元数据编目的优势元数据字段的自动处理元数据编目的实例— PQDT 全文问题与思考

Page 3: 电子资源的元数据编目实践

电子资源的元数据编目实践

上交大电子资源的种类和数量

类型 馆藏数量

外文电子期刊 2.5万种

外文电子图书 6.5万册

外文学位论文 20万篇

中文电子期刊 1 万种

中文电子论文 95.1万篇

中文电子图书 136万册

视频报告 1.5万种

电子古籍 1 万种

Page 4: 电子资源的元数据编目实践

电子资源的元数据编目实践

电子资源整合与揭示的策略

方便用户资源发现与使用提高资源利用效率满足不同层次用户的需要多途径、多角度整合揭示尽可能延伸揭示的广度与深度统一分类体系

Page 5: 电子资源的元数据编目实践

电子资源的元数据编目实践

电子资源整合与揭示框架

Page 6: 电子资源的元数据编目实践

电子资源的元数据编目实践

思源探索 -Primo(1)

Page 7: 电子资源的元数据编目实践

电子资源的元数据编目实践

思源探索 -Primo(2)

Page 8: 电子资源的元数据编目实践

电子资源的元数据编目实践

上交大电子资源的编目现状类型 MARC记录入库情况

外文电子期刊 基本已经分编,需要维护 856字段

外文电子图书 基本已经分编 ,部分图书无中图分类号

外文学位论文 未分编

中文电子期刊 基本已经分编,需要维护 856字段

中文电子论文 未分编中文电子图书 未分编视频报告 未分编电子古籍 未分编

Page 9: 电子资源的元数据编目实践

电子资源的元数据编目实践

元数据编目的优势

数据的结构化 - 可读性、兼容性数据的交换性数据的批处理 - 使用 Excel 、 ACCESS 的功能数据的自动处理

Page 10: 电子资源的元数据编目实践

电子资源的元数据编目实践

元数据字段的自动处理

分类的自动映射 数据的自动整理

Page 11: 电子资源的元数据编目实践

电子资源的元数据编目实践

PQDT 全文元数据处理 - 数据整理原字段名 字段名 处理意见 001 出版号 保留005 删除008 语种 需处理、只保留 eng, fre等语种代码。空白的人工判断。

020a ISBNISBN 为 10位,部分数据丢失“需处理,用函数添加 ,9位 ISBN前添加 1个“, 8 位 ISBN前添加 2个“

035a 删除040a 删除040c 删除100a 作者 保留245a 论文名称 保留300a 页数 保留500a 来源 统一改成 PQDT全文502a 学位、年代 需处理,用分隔符导入、拆分字段520a 摘要 删除590 删除650a 学科 保留,部分数据与分类映射表字段的格式不一致,需处理。

690a 删除710a 学校 保留、有很多错位,如在其它字段( 710b)需移到

710b 保留删除

增加字段 资源类型 学位论文增加字段 Format PDF

增加字段 分类号通过分类映射表自动分类,把元数据表和分类映射表导入 Access,用 Access的查询功能匹配

增加字段 URL公司不提供 URL、也不提供 URL语法,用函数自己合成,变量是“出版号”,“出版号”前后的字符串保持一致。

Page 12: 电子资源的元数据编目实践

电子资源的元数据编目实践

PQDT 全文的 URL 处理

URL 样本:http://pqdd.lib.sjtu.edu.cn/umi/document?RecordNo=1&ColumnName=Pdf_name&MultiNo=0&issource=yes&type=bin&isdownload=yes&searchword=pub_number%3DAAI1403957&singlesearch=no&channelid=%CF%B8%C0%C0

上图中的 URL 样本由三个部分构成,其中红色和蓝色的部分为固定字符串(对每条记录均一样)。其中的黑色字段为每篇论文的出版号,是每一个URL 中的变量, URL 可以通过函数合成。

Page 13: 电子资源的元数据编目实践

电子资源的元数据编目实践

设置元数据库转换模版

Page 14: 电子资源的元数据编目实践

电子资源的元数据编目实践

PQDT 元数据转换模版字段对照表

Page 15: 电子资源的元数据编目实践

电子资源的元数据编目实践

问题与思考

元数据的质量控制与规范关于 FRBR (Functional Requirements for Bibliographic Records)

模型的适应性建立元数据编目的分工、合作和共享机制

Page 16: 电子资源的元数据编目实践

谢谢!