98
第第第第第第第第第第

第一讲 文献信息检索基础知识

Embed Size (px)

DESCRIPTION

第一讲 文献信息检索基础知识. 第一节 信息与信息素养 第二节 科技文献的类型 第三节 信息检索与文献检索工具 第四节 信息检索原理 第五节 信息检索的方法和途径 第六节 信息检索常用技术及检索效果评价. 第一节 信息与信息素养. 一、信息的基本含义. 1 、图书馆学和情报学领域,信息被定义为事物或记录。 2 、综合学术界对信息的定义,可以认为信息是以物质介质为载体,传递和反映世界各种事物存在方式、运动规律及特点的表征。. 风、雨、雷、电、春、夏、秋、. 自然信息. 社会信息. - PowerPoint PPT Presentation

Citation preview

Page 1: 第一讲   文献信息检索基础知识

第一讲

文献信息检索基础知识

Page 2: 第一讲   文献信息检索基础知识

第一节 信息与信息素养 第二节 科技文献的类型 第三节 信息检索与文献检索工具 第四节 信息检索原理 第五节 信息检索的方法和途径 第六节 信息检索常用技术及检索效果评价

Page 3: 第一讲   文献信息检索基础知识

第一节 信息与信息素养

Page 4: 第一讲   文献信息检索基础知识

一、信息的基本含义

1 、图书馆学和情报学领域,信息被定义为事物或记录。2、综合学术界对信息的定义,可以认为信息是以物质介质为载体,传递和反映世界各种事物存在方式、运动规律及特点的表征。

Page 5: 第一讲   文献信息检索基础知识

风、雨、雷、电、春、夏、

秋、

自然信息

语言、战争、贫困、喜、怒、哀、

社会信息

科学家破译染色体的基因信

科学信息

Page 6: 第一讲   文献信息检索基础知识

从生产力的角度可以将人类社会划分为四个发展阶段:原始社会、农业社会、工业社会和信息社会。信息社会的主要标志是信息与知识成为社会最重要的基础性资源。

(一)信息与社会

Page 7: 第一讲   文献信息检索基础知识

在人类漫长的发展历程中,物质、能量、信息三种资源支配着人类最基本的生产活动。 物质 --- 向人类提供材料及生活必需品 信息 --- 向人类提供知识和智慧 能量 --- 向人类提供动力 信息社会的主要标志是信息与知识成为社会最重要的基础性资源。

Page 8: 第一讲   文献信息检索基础知识

1. 客观性2. 时效性3. 载体性4. 传递性5. 可塑性6. 共享性7. 可开发性8. 可增值性

(二)信息的基本特征

Page 9: 第一讲   文献信息检索基础知识

一个完整的信息传递过程必须具备信源(信息的发出体)、信宿(信息的接受体)、信道(信息的传递媒介)和信息四个基本要素。

Page 10: 第一讲   文献信息检索基础知识

1. 知识知识是人们对客观事物的认识和经验总和。知识与信息的关系:知识是信息的一部分,不直接等同于信息;知识是人类大脑活动的产物,是系统化、精炼化的信息。 2. 情报情报是传递中的有用的知识或信息,是为解决特定问题所需要的知识。

(三)与信息有关的基本概念

Page 11: 第一讲   文献信息检索基础知识

3. 文献

文献是记录知识的一切载体。

三个基本要素:

1)文献含有知识信息 ;

2 )负载知识信息的物质载体 ;

3)记录知识信息的符号和技术 ;

Page 12: 第一讲   文献信息检索基础知识

二、什么是信息素养

信息素养有广义狭义之分。广义指信息社会对个人品质、道德观念、知识体系和能力要求的总合,或信息时代国民应有的素质,包括品质和能力两个方面。狭义指获取信息和使用信息的能力与品质。

Page 13: 第一讲   文献信息检索基础知识

信息素养教育的提出是文化积淀的产物 人是环境的产物。信息素养教育的提出,既是社会演进的要求也是

文化积淀的结果。英语中 literacy 翻译成汉语是有文化的意思,它的否定表达方式是“非文盲”,反义词是文盲( illiteracy )。在传统社会里,文盲占人口的大多数,有文化的只限于少数人。中世纪的欧洲,文化掌握在天主教神职人员之手,目不识丁的国王,屡见于史。中世纪晚期,印刷术的发明为文化的普及开辟了道路。工业社会需要有文化的劳动力,提出了扫除文盲,普及教育的要求。Literacy 的标准是会读、会写、会算。图书馆事业兴起后,开展用户教育提出了图书馆素养(或文化)问题,称之为 library literacy 。计算机普及后,为了加强计算机技能教育,便有了计算机文化 computer literacy 或计算机素养之说,也有称之为数字化素养( digital literacy )网络素养( network literacy )和媒体素养( meidia literacy )的。在信息技术和信息产业发达的国家里最早提出了信息素养 (information literacy) 的概念。美国信息产业协会主席保罗 . 泽考斯基( Paul Zurkowaski ) 1974 年在美国全国图书馆与情报学委员会上,最早提出了信息素养的概念,他把信息素养概括为:“利用大量的信息工具及主要信息源使问题得到解答的技术和技能。”

Page 14: 第一讲   文献信息检索基础知识

第二节 科技文献的类型

Page 15: 第一讲   文献信息检索基础知识

一、文献的主要类型

(一) 按载体类型分: 印刷型、缩微型、电子型、声像型

(二) 按出版类型分: 图书、连续出版物、特种文献

(三)按加工深度分:一次、二次、三次

Page 16: 第一讲   文献信息检索基础知识

( 一 ) 根据文献的载体形式划分

印刷型 缩微型 电子型 声像型

连续出版物

缩微平片

缩微胶卷

缩微胶片

磁带、磁

盘 光

联机网络

版 录音带、录像

带 唱片、幻灯

片 电影胶卷

Page 17: 第一讲   文献信息检索基础知识

印刷型文献

载体:纸张实例:教科书记录手段:油印、石印、 铅印、胶印、复印特点:可直接阅读,方便 使用;但难于实现机 械化和自动化;收藏 文献占用空间大。

利用纸张为存储介质,以手写、印刷为记录手段而产生的文献。包括油印、铅印、胶印、复印等印刷品及手稿。

Page 18: 第一讲   文献信息检索基础知识

缩微型文献

载体:感光材料 实例:缩微平片、缩微胶片记录手段:光学缩微技术特点:体积小;价格低;不能直接阅读

是以感光材料为存储介质,利用缩微照相技术使文献缩微化的文献。

Page 19: 第一讲   文献信息检索基础知识

声像型文献

载体:磁性材料、感光材料实例:录像带、幻灯片记录手段:磁记录、光学技术特点:直观、生动、形象;成 本高;不易检索和更新。

以磁性或感光材料为存储介质,利用特定的设备及技术,直接记录声音、图像信息的文献。

Page 20: 第一讲   文献信息检索基础知识

电子型文献

载体:磁性材料实例:磁盘、光盘记录手段:计算机输入特点:存储密度高、速度快 ; 易复制 ;成本高;不能 直接阅读。

以电子数据的方式将图、文、声、像等信息存储在磁光介质上,通过网络通信、计算机或类似设备再现的信息资源 。

Page 21: 第一讲   文献信息检索基础知识

按出版形式及内容的不

同 图 书

连续出版物

特种文献

科技报告会议文献政府出版物专利文献标准文献产品资料学位论文

期刊报纸

( 二 ) 根据文献的编辑出版形式划分

Page 22: 第一讲   文献信息检索基础知识

图书的含义

凡篇幅达 48页以上并构一个书目单元的文献称为图书。

国际标准书号( ISBN )

Page 23: 第一讲   文献信息检索基础知识

国际标准书号 (ISBN)(International Standard Book Number) 每一种正式出版的图书的唯一标识代码,是专门为识别

图书等文献而设计的国际编号。例如:《信息检索原理与方法教程》,赵岩碧主编,化学工业出版社, 20

05 年 3 月出版。其 ISBN 号为: 7-5025-6431-4 ISBN 7-5025-6431-4 ( 旧号 ) ISBN 978-7-5025-6431-5 ( 2007 年后出版图书采用的新号)

第一段: 978 是由国际物品编码( EAN·UCC )系统专门提供给国际 ISBN 管理系统的产品标识编码。

第二段: 7 语区号,代表国家、地区、语种    如 0 和 1 -英, 2 -法, 3 -德, 4 -日, 5- 俄, 7 -中, 88-

意大利, 9971- 新加坡第三段: 5025 出版社代号 ,由国家或地区 ISBN 中心分配;第四段: 6431 出版图书号,由出版社按出版顺序所给;第五段:校验位

Page 24: 第一讲   文献信息检索基础知识

期 刊

期刊又称杂志,它是指采用统一名称定期或不定期出版的连续性出版物。

国际标准刊号( ISSN )

Page 25: 第一讲   文献信息检索基础知识

国际标准连续出版物号( ISSN )

正式出版的期刊有 ISSN 代码,即国际标准连续性出版物编号,是国际连续出版物数据系统国际中心为在该系统登记的连续出版物分配的号码。采用 ISSN 编码系统的出版物有期刊、会议录等。如:《中国图书馆学报》国际标准刊号: ISSN1001—8867全长 8位 ,前 7位为刊名代号 , 末位为校验位

Page 26: 第一讲   文献信息检索基础知识

期刊的特点

A、期刊以品种为单位形成知识流;B、报道文献速度快,内容新颖 ,能及时反映世界科 技水平,但不如图书成熟;C、品种多,数量大,覆盖了人类所以知识领域及各 学科专业,具有很强的容纳 性。D、科技期刊 是最重要的一次文献。

Page 27: 第一讲   文献信息检索基础知识

核 心 期 刊

* 少数刊载某一学科大量高质量专业论文的期刊。 * 特点 ( 1)刊载专业文献密度高,信息含量高; ( 2)水平较高,代表本学科的最新发展水平; ( 3)出版相对稳定,所载文献寿命较长; ( 4)利用率和被引率较高。 目前,许多单位核心期刊的判定是以 《中文核心期刊要目总览》为标准

Page 28: 第一讲   文献信息检索基础知识

是以报道新闻及评论为主,出版周期比期刊更短,多为活页性连续出版物。其特点是内容丰富 、信息量大、出版迅速 、发行量大、读者众多。

报 纸

Page 29: 第一讲   文献信息检索基础知识

科 技 报 告

科技报告是科技工作者对科学、技术研究结果或研究进展的记录。

科技报告的特点( 1)反映新的科研成果迅速;( 2)内容多样 化;( 3)质量参差不齐;( 4)保密性强;( 5)每份报告独立成册,有连续编号。

Page 30: 第一讲   文献信息检索基础知识

    会 议 文 献

  会议文献是指在各种会议上宣读、交流的论文、报告及其它有关文献。

Page 31: 第一讲   文献信息检索基础知识

   政 府 出 版  物

  政府出版物是指由政府机构制作出版或由政府指定出版商 出版的文献。

政府出版物的类型( 1)行政性文件( 2)科技文献

Page 32: 第一讲   文献信息检索基础知识

专 利 文 献

专利文献是指实行专利制度的国家申请、审批专利过程中所产生的专利申请书、说明书及官方文件或出版物。其中最重要的是专利说明书。

Page 33: 第一讲   文献信息检索基础知识

    标 准 文 献

  与标准化活动有关的一切文献都称为标准文献。其主体是标准,还包括标准形成过程的各种档案、宣传推广标准的手册及其它出版物。

标准是按规定程序制订,经权威机构公认或主管部门批准的在特定范围内执行 的规格、规则、技术要求等规范性文件。

Page 34: 第一讲   文献信息检索基础知识

产 品 资 料

指厂商为推销产品而印制的各种宣传资料、技术资料。如公司介绍、产品目录、样本、说明书等,它反映厂家、公司及产品的有关信息,对产品采购,仪器设备的维护、使用及新产品开发具有重要价值。

Page 35: 第一讲   文献信息检索基础知识

按文献的加工深度分

一次文献 二次文献 三次文献

(三)不同加工层次的文献信息

Page 36: 第一讲   文献信息检索基础知识

一 次 文 献* 作者以自己的研究成果为基础创作或撰写, 并通过某种渠道而公开的文献;* 对知识的第一次加工;具有创造性;* 大多数期刊论文、科技报告、学位论文、会 议文献、专利文献、技术档案等。

Page 37: 第一讲   文献信息检索基础知识

* 对一次文献进行浓缩、整序及加工处理而成 的具有报道和检索作用的文献; * 对知识的第二次加工;有序化;提供一次文 献线索; * 目录、题录、文摘等检索工具。

二 次 文 献

Page 38: 第一讲   文献信息检索基础知识

* 指从一次文献中提取数据、事实和有关结论, 并经过综合分析与重新组合而编写的文献。* 对知识的再加工;提供文献检索;* 综述、专著 ;字词典、百科全书

三 次 文 献

Page 39: 第一讲   文献信息检索基础知识

一次文献是检索的对象(目标)

二次文献是检索的工具(手段) 三次文献是情报研究的成果(检索目标 +检索手段)

从检索的角度来看

一次、二次、三次文献三者之间的关系

Page 40: 第一讲   文献信息检索基础知识

从知识加工角度来看

一次、二次、三次文献三者之间的关系

从一次文献到二次文献、三次文献是一个由博到约、由分散到集中、由无组织到系统化的过程,也是科技文献资源的层次结构由无序走想有序、由一种有序结构演变为另一种完善的有序结构的过程。

Page 41: 第一讲   文献信息检索基础知识

第三节 信息检索与信息检索工具

Page 42: 第一讲   文献信息检索基础知识

一、信息检索的定义及类型

(一)信息检索的定义

广义的信息检索 : 是指将信息按一定的方式组织和存储起来 , 并根据信息用户的需要找出有关信息的过程和技术。全称为“信息存储与检索” 。

狭义的信息检索 : 指该过程的后半部分 , 即从信息集合中找出所需要的信息的过程 , 相当于人们通常所说的信息查寻。

人们多用“文献检索”的概念,强调了检索对象。

Page 43: 第一讲   文献信息检索基础知识

(二)信息检索的类型1 、按检索内容 划分: 文献检索、数据检索、事实检索2 、按信息检索手段划为: 手工检索、计算机检索3 、按信息组织方式划分: 全文检索、超文本检索、超媒体检索

Page 44: 第一讲   文献信息检索基础知识

第四节 信息检索原理

Page 45: 第一讲   文献信息检索基础知识

将文献检索标识与文献存贮标识进行类比,二者若取得一致(即二者匹配),就可将文献库中符合检索提问要求的文献取出来。

信息检索的原理

简而 言之

检索标识 存贮标识匹配

检索命中

将文献检索标识与文献存贮标识进行类比,二者若取得一致(即二者匹配),就可将文献库中符合检索提问要求的文献取出来。

Page 46: 第一讲   文献信息检索基础知识

原始文献

加工整理

数据库

提 问

检 索

输 出存 储

检 索

Page 47: 第一讲   文献信息检索基础知识

检索过程分析

检索者 检索系统

信息源(大量信息)充分标注(检索语言)

可检索(检索技术、规则等)可显示(屏幕显示或打印)

信息之间的连接等 

表达需求

反馈结果

信息检索的本质,实际上就是信息集合与需求集合的匹配与选择。

Page 48: 第一讲   文献信息检索基础知识

第五节 信息检索的方法和途径

Page 49: 第一讲   文献信息检索基础知识

(一)信息检索语言

Page 50: 第一讲   文献信息检索基础知识

检索语言主要有: 1 、分类语言: 以学科体系为基础,将各种概念按学科性质进行分

类和系统排列,并用分类号予以编排组织成一个完整的体系。

2、 主题语言: 用词语来表达各种概念,即用规范化或未规范化语

言中的名词、名词性词组或短语作为主题词,来表达各种概念,将各种概念不管其相互关系,完全按字顺排列。

3 、号码语言: 按文献代码,如专利号、 标准号、报告号等的顺序

排检。

Page 51: 第一讲   文献信息检索基础知识

《中图法》体系结构:基本部类( 5个) 基本大类( 22个)

1.马列、毛泽东思想: A 马列、毛泽东思想2. 哲学 : B 哲学3. 社会科学 : C 社会科学总论; D 政治、法律; E

军事; F 经济; G 文化、科学、 教育、体育 ; H 语言、文字; I 文学; J 艺术; K 历史、地理4. 自然科学 : N 自然科学总论; O 数理科学和化学; P

天文学、地球科学; Q生物科学; R 医学、 卫生; S 农业科学; T 工业技术; U 交 通运输; V 航空、航天; X 环境科学、劳 动保护科学(安全科学)5. 综合性图书 : Z 综合性图书

Page 52: 第一讲   文献信息检索基础知识

《中图法》 22 大类是基础,每一大类下根据学科的具体内容层层细分为二级、三级、四级......类目,这逐级划分下去就形成了等级分明的科学系统。如:    O     一级类目      数、理、化          O1   O3   O4   O6   O7 …… 二级

类目      数学  力学  物理  化学  晶体      O11  O12     O13 …… 三级类目   古典数学  初等数学  高等数学  O121 O122   O123    O124 四级类目 算术 初等代数 初等几何 三角

中图法全称为“中国图书馆分类法”中图法全称为“中国图书馆分类法”

所有图书按中图法编制成相应的索书号进行排架所有图书按中图法编制成相应的索书号进行排架

Page 53: 第一讲   文献信息检索基础知识

什么是关键词

直接选用文献中的自然语言作为基本的词汇,出现在文献标题(篇名、章节名)、摘要和正文中,能揭示和描述文献主题内容具有实质意义的的那些词语,且不加规范化处理。

Page 54: 第一讲   文献信息检索基础知识

(二)文献信息检索方法

常用法

回溯法

循环法

Page 55: 第一讲   文献信息检索基础知识

常用法(又称工具法)

1.顺查法:由远及近,从后向前。

如:已知某研究课题的最初产生年代( 1990)了解 发展过程

从最初的年代( 1990)开始,逐步往近期查

2.倒查法:由近及远,从前向后。一般查 1-5年,重点:在近期文献,只要查到基本满足需要为止。

3.抽查法:是抓住某学科发展迅速,研究成果发表较多的时期,进行重点检索。前提:熟悉学科发展特点。

指直接利用检索工具(系统)检索文献信息的方法,这是文献检索中最常用的一种方法。

Page 56: 第一讲   文献信息检索基础知识

回溯法(引文法)

回溯法是指不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地回溯查找“引文”的一种最简便的扩大情报来源的方法。它还可以从查到的“引文”中再回溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的内容 相关文献。

优点: 在没有检索工具或检索工具不全的情况下能借助一些引文索引,述评或专著的参考文献查找。

缺点: 查得的文献不全面,比较陈旧。

Page 57: 第一讲   文献信息检索基础知识

循环法(又称为分段法)

它是把上述两种方法加以综合运用的方法,既要利用

检索工具进行常规检索,又要利用文献后所附参考文献进

行回溯检索,分期分段地交替使用这两种方法。

Page 58: 第一讲   文献信息检索基础知识

(三)文献信息检索途径

分类途径

主题途径

著者途径

其他途径

Page 59: 第一讲   文献信息检索基础知识

1. 分类途径

分类途径是指按照文献资料所属学科(专业)类别进行检索的途径,它所依据的是检索工具中的分类索引。

分类途径检索文献关键在于正确理解检索工具的分类表,将待查项目划分到相应的类目中去。

Page 60: 第一讲   文献信息检索基础知识

2. 主题途径

主题途径是指通过文献资料的内容 主题进行检索的途径,它依据的是各种主题索引或关键词索引,检索者只要根据项目确定检索词(主题词或关键词),便可以实施检索。

主题途径检索文献关键在于分析项目、提炼主题概念,运用词语来表达主题概念。主题途径是一种主要的检索途径。

Page 61: 第一讲   文献信息检索基础知识

3. 著者途径

著者途径是指根据已知文献著者来查找文献的途径,它依据的是著者索引,包括个人著者索引和机关团体索引。

Page 62: 第一讲   文献信息检索基础知识

4. 其他途径

其他途径包括利用检索工具的各种专用索引来检索的途径。

专用索引的种类很多,常见的有各种号码索引(如专利号、入藏号、报告号等),专用符号代码索引(如元素符号、分子式、结构式等),专用名词术语索引(如地名、机构名、商品名、生物属名等)。

Page 63: 第一讲   文献信息检索基础知识

课堂讨论题: 找一些有关翻译技巧的书刊 , 用馆藏查

询的哪些途径可以获得?

Page 64: 第一讲   文献信息检索基础知识

(四)文献信息检索步骤

文献信息检索是根据课题的要求,利用检索工具,按照一定的步骤和方法查找文献信息的过程。完成

这个过程一般需要经过五个基本步骤:

Page 65: 第一讲   文献信息检索基础知识

1 、分析课题与确定检索要求2 、选择检索方式与检索工具3 、确定检索途径与方法4 、优化检索提问与策略5 、整理检索结果6 、获取原文

Page 66: 第一讲   文献信息检索基础知识

第六节 信息检索常用技术及检索效果评价

Page 67: 第一讲   文献信息检索基础知识

一、信息检索常用技术

布尔逻辑检索截词检索位置检索字段限制检索

Page 68: 第一讲   文献信息检索基础知识

1 、布尔逻辑检索 在计算机文献检索中,用户的检索需求是通过检索提问式表达的,用逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。

布尔逻辑运算符:系统中采用的逻辑组配算符是布尔代数中的逻辑运算符 AND/*(与)、 OR/+(或)、 NOT/—(非)。

( 1) AND 或 * 算符 实现逻辑“与”组配

检索时,命中信息同时含有两个概念,专指性强。

如: traffic AND control

Page 69: 第一讲   文献信息检索基础知识

( 2 ) OR 或 + 算符 实现逻辑“或”组配

( 3 ) NOT 或 – 算符 实现逻辑“非”组配

检索时,命中信息包含所有关于逻辑 A 或逻辑 B 或同时有 A 和 B 的,检索范围比 AND 扩大。

如: railway OR railroad

命中信息包含逻辑 A 、不包含逻辑 B 或同时有 A 和 B 的,排除了不需要的检索词。

如: fruit NOT apple

Page 70: 第一讲   文献信息检索基础知识

布尔逻辑算符优先顺序

执行优先顺序通常是: NOT>AND>OR。优先处理算符 --- “()”。与布尔逻辑算符搭配使用调整逻辑运算符的运算顺序,使某些算符优先进行逻辑匹配。

Page 71: 第一讲   文献信息检索基础知识

课堂讨论题: 试分析以下检索内容,利用布尔逻辑算符,

构建出相关的检索式1 、检索数控机床的产品信息的相关文献 2 、检索计算机算法或程序语言的相关文献 3 、检索除因特网之外的计算机相关文献 4 、检索工业模具设计与制造的相关文献

Page 72: 第一讲   文献信息检索基础知识

2 、截词检索

截词是指将检索词在适当的地方截断,截词检索是用截断词的一个局部进行的检索,凡是满足这个截词所有字符 (串 )的记录,系统都为命中。

截词检索主要是利用检索词的词干或不完整的词形进行检索。

截词检索在西文数据库中广泛使用。是在词干后可能变化的位置加上截词符号。检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。这样既可减少检索词的输入量 , 又可扩大查找范围,提高查全率。

按截词位置分 : 前截断、后截断、中间截断、左右截断; 按截词的字符数量分:有限截词、无限截词。 “?”、“ * ” 表示截词的截断符号,各检索系统有不同的规定,没有统一标准。

Page 73: 第一讲   文献信息检索基础知识

① 前截断

在检索字符串前方(左方)截断有限或无限的字母。 如:输入 *chemistry  可检出: microchemistry (微量化学)

macrochemistry (常量化学) abiochemistry ( 无机化学 )

iatrochemistry (化学疗法) ……

这种方法可以省略输入各种词头有变化的检索词的麻烦。

Page 74: 第一讲   文献信息检索基础知识

② 后截断 在检索字符串后(右方)截断有限或无限的字母。

如: librar* library , librarian , libraries……

这种方法可以省略输入各种词尾有变化的检索词的麻烦。 主要用于 单复数检索(如 Econom* : Economy , Economics , Economical…… ) 词根检索( buil* : building , built…… ) 年代检索( 199* : 1990 , 1991……1999 ) 等

Page 75: 第一讲   文献信息检索基础知识

③ 中间截断 在检索词中间嵌入截断符号,允许检索词中间

有若干形式的变化。 如:输入 wom*n 可检出: woman , wo

men 输入 defen*e 可检出: defence( 防卫 ) ,

defense ……

主要解决一些英美拼写不同,单复数形式不同的词的输入。

Page 76: 第一讲   文献信息检索基础知识

④ 左右截断 将检索词左右词头、词尾部分同时截断,检

索词中间一致。 如:输入 *biolog* 可检出: neurobiology (神经生物学)

neurobiologist microbiology (微生物学) microbiologist …… 适用于广泛课题的资料检索

Page 77: 第一讲   文献信息检索基础知识

⑤ 有限截词 对词干以外可以出现的字母数量进行限定。  如: 输入 computer?? 表示截断处有 0-2 个字

母变化,可检出: computer , computers ,……

输入 stud??? 表示截断处有 0-3 个字母变化,

可检出 :study , studies , studied , student , ……

Page 78: 第一讲   文献信息检索基础知识

⑥ 无限截词 不限制被截断的字符数量。在检索词后加一个“ *

” ,表示该词后可加任意个字符。 如:输入 educat* 可检出 educate , educator , educators ,

educated , educating , education ,……

注意:使用无限截词,所截词根不能太短,否则会输出许多无关文献,造成误检。

Page 79: 第一讲   文献信息检索基础知识

3 、位置检索

通过位置运算符来规定和限制检索词之间的相对位置,弥补布尔逻辑运算符构造某些提问式的不足,表达复杂专深的概念,从而提高检索的专指度。

位置算符通常只出现在英文数据库中,多用于全文检索。 Dialog等一些大型检索系统才支持位置算符。 在检索提问式中同时出现位置算符和逻辑算符时,执行的先

后顺序为:先位置算符,后逻辑算符

注:不同的机检系统,位置算符的功能及算符不同,也有的检索系统不支持位置运算符,检索之前应该先看看数据库的帮助信息。

Page 80: 第一讲   文献信息检索基础知识

② 字段算符

F 、 L

位置检索

①相邻位置算符W 、 nW ;N 、 nN

③句子位置算符 S

Page 81: 第一讲   文献信息检索基础知识

① 相邻位置算符: W  nW 

W: with 的缩写 两词相邻,词序不变,中间不可插词,但两词之

间可有一个标点、连字符或空格。   例:输入 CD(W)ROM 将命中 CD ROM 或 C

D-ROM    输入 solar (W) energy 检出 solar energy

Page 82: 第一讲   文献信息检索基础知识

nW

nW: nword 的缩写 两词之间允许插入 0-n 个词,词序不变。   例: communication (2W) satellite

将检索出含有 communication satellite 、 communication via satellite 、 communication on the satellite 的记录

Page 83: 第一讲   文献信息检索基础知识

N   nN

N: near 的缩写 两词中间不可插词(但两词间可有一个标点,

连字符或空格),允许词序发生颠倒。 例:输入 cross (N) section

可检出 cross section 和 section cross

Page 84: 第一讲   文献信息检索基础知识

nN: nnear 的缩写 两词中间可插 0 ~ n 个词 ( 两词间可有一个

标点,连字符或空格 ) ,允许词序发生颠倒。

例:输入 cotton (2N) processing可检出 cotton processing 、 processing of c

otton 、 processing of Egyptian cotton

Page 85: 第一讲   文献信息检索基础知识

② 字段算符: F 

F: field 的缩写 两词必须出现在同一字段中 ( 如篇名、文摘、叙

词等 ) ,词序与词量不限制。

如:输入 pollution(F)control /AB  检出的结果中 pollution 和 control 同时出现

在文摘 (abstract) 字段中

Page 86: 第一讲   文献信息检索基础知识

③ 句子位置算符: S

S: Sentence 的缩写 两词必须出现在同一句子或子字段中 , 词序与插入词量不

受限制。

如:输入 computer(W)control(S)system 可检出文摘中含有“ This paper is concerned with an application of the computer control technique in a intelligent system for testing inner walls of pipes.”这样一句话的文献记录。

Page 87: 第一讲   文献信息检索基础知识

短语检索

字段检索

4 、限制检索

Page 88: 第一讲   文献信息检索基础知识

① 短语检索 将检索词用双引号””括起作为一个独立运算单元,进行严格匹配,以提高检索准确度。

例:” Global Positioning System” (GPS,全球定位系统 ) 只检索出规定字段中包含完整词组的记录。

Page 89: 第一讲   文献信息检索基础知识

② 字段检索 为了缩小检索范围,可利用字段代码来限制检索词出现的字段,以提高检索速度和查准率。

如: rice in ti (表示只在题目字段中查找文献)

rice in ab (只在文摘中查找) au = Smith, J.C (查作者为 Smith, J.C 的 文章 ) py = 1998(只查 1998年的文章 ) la =Chinese (只查语种为中文的文献 )

Page 90: 第一讲   文献信息检索基础知识

常用检索字段中英文对照西文数据库常用字段

中文数据库常用字段字段名称 字段代码

Abstracts AB 文摘Author AU 作者Corporate Source 、 Organization 、 Company

CS 机构名称

Descriptor 、 Subject DE 叙词 / 主题词Document Type DT 文献类型Full-text FT 全文ISSN / ISBN ISSN / ISBN 国际标准连续出版物

号 / 书号Journal Name 、 Publication Title

JN 期刊名称

Keyword 、 Topic KW 关键词Language LA 语言Publication Year PY 出版年Title TI 题名

Page 91: 第一讲   文献信息检索基础知识

查全率(检全率)

查准率(检准率)

100%相关统

检出相关文献量检全率

文献总量中系

%100检出文献总量

检出相关文献量检准率

二、检索效果评价

Page 92: 第一讲   文献信息检索基础知识

漏检率

误检率

%100系统中相关文献总量

漏检相关文献量漏检率

%100检出文献总量误检文献量

误检率

Page 93: 第一讲   文献信息检索基础知识

二、影响检索效果的主要原因

信息系统组织结构、检索系统功能问题

检索策略、检索方法问题

Page 94: 第一讲   文献信息检索基础知识

三、提高检索效果的措施

熟悉各种信息系统特征认真分析课题需求灵活掌握检索方法和提高制定检索策略的能力

Page 95: 第一讲   文献信息检索基础知识

( 1 )输出篇数过多时 此时多数是由误检造成的,原因主要有以下几点:1) 没有对检索词进行限制。包括字段限制,时间限制,分类

限制等。2 )主题概念不够具体或具有多义性导致误检。例如,仅使

用 mathematics 进行检索结果很多,就需要整检索策略,将概念具体化。如: mathematics and economic 再如,检索世界贸易组织仅输入“ WTO” ,系统

可能会检索出“ World Tourism Organization” (世界旅游组织)

3) 对所选的检索词截词截得过短。例如, 使用 math? 将有太多的检索结果。

等等……

Page 96: 第一讲   文献信息检索基础知识

检索结果的反馈调整

缩小检索范围的措施 提高检索词的专指度。 增加 AND 连接,进一步限定主题词。 把检索词限定在主要字段,如标题字段、主题

词字段等。 缩短检索年限,或限定某些刊物。

Page 97: 第一讲   文献信息检索基础知识

( 2 )输出篇数过少时 此时多数是由漏检造成的,原因可能有以下几点:1 )选用了不规范的主题词或某些产品的俗称、商品名作为检索词。

例如,没有使用学名“马铃薯”而使用了俗名“土豆”又如,没有使用“表面活性济”而使用了商品名称“迪恩普”,

都会造成漏检。2 )同义词没有充分考虑。

例如,检索“物理化学”,没有考虑到“物理有机化学”,“物化”等同义词,导致漏检。

3 )上位概念或下位概念没有完整运用。例如,“燃料”是上位概念,下位概念可以有“固体燃料”、

“液体燃料”、“气体燃料”,甚至还有“煤”、“油”、“煤气”、“天然气”等,这些概念在检索“燃料”时都应该加以考虑。

等等……

Page 98: 第一讲   文献信息检索基础知识

检索结果的反馈调整

扩大检索范围的措施 降低检索词的专指度,可从词表或检出文献中

选择泛指词。 调节检索式的网罗度,如删除某个不重要的检

索词。 进行族性检索,可用分类号或用 OR 连接一组

同义词和近义词。 取消某些限制过严的限制符。