14
淘淘 / 淘淘淘淘 1 信信信信信信信信信信信 信信信信信信信信 淘淘淘淘淘淘 淘淘淘 E-mail [email protected] 淘淘26684017

信息检索基础知识与信息 检索技巧专题讲座

Embed Size (px)

DESCRIPTION

信息检索基础知识与信息 检索技巧专题讲座. 天津商学院图书馆 吴凤玉 E-mail : [email protected] 电话: 26684017. 淘花 / 百度专用. 1. 一、信息检索. 信息检索是将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术 。 对于信息用户而言,就是从信息集合中找出所需信息的过程。 信息检索基本原理: 提问标识(检索式)与文献标识的对比. 淘花 / 百度专用. 2. 二、信息检索途径. 检索途径: 又称为检索点。 依据文献的 外部特征 (题名、责任者、 出版者、出版时间等) - PowerPoint PPT Presentation

Citation preview

Page 1: 信息检索基础知识与信息 检索技巧专题讲座

淘花 / 百度专用 1

信息检索基础知识与信息检索技巧专题讲座

天津商学院图书馆吴凤玉

E-mail : [email protected]

电话: 26684017

Page 2: 信息检索基础知识与信息 检索技巧专题讲座

淘花 / 百度专用 2

一、信息检索

信息检索是将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。

对于信息用户而言,就是从信息集合中找出所需信息的过程。

信息检索基本原理: 提问标识(检索式)与文献标识的对比

Page 3: 信息检索基础知识与信息 检索技巧专题讲座

淘花 / 百度专用 3

二、信息检索途径 检索途径: 又称为检索点。 依据文献的外部特征(题名、责任者、 出版者、出版时间等) 和内容特征(分类号、主题词、关键词 或自由词等)来确定,是信息检索的入口点。

Page 4: 信息检索基础知识与信息 检索技巧专题讲座

淘花 / 百度专用 4

常用检索途径 题名(篇名)途径:利用篇名中的字词或篇名

的一部分进行检索。其结果是所有在篇名中出现该字、该词或该部分的文章。

著者途径:利用文献作者名字进行检索。可查到该作者的所有文献。

分类途径:利用分类名和分类号进行检索。其结果是该类目所有的文献。

Page 5: 信息检索基础知识与信息 检索技巧专题讲座

淘花 / 百度专用 5

主题途径:利用与该篇文献主题相关的规范词(主题词)进行检索,其结果是包含该主题词的所有文献。

关键词途径:利用与该篇文献主题相关的关键词(自由词)进行检索,其结果是包含该关键词的所有文献。

序号途径:利用文献的各种代码、数字编制的索引查找文献,如专利号、技术标准的标准号、科技报告的报告号等。

其他途径:如文献类型、参考文献、语种、出版(发表)年份、作者机构、出版机构等。

Page 6: 信息检索基础知识与信息 检索技巧专题讲座

淘花 / 百度专用 6

三、信息检索常用方法( 一 ) 布尔逻辑: 用布尔逻辑算符来表达检索词间的逻辑组配关系,

是最基本、最常用的检索技术。 -- 逻辑或( + , OR ):表达检索词间的并

列关系。可扩大检索范围,提高查全率。如: A+B ,表明结果中含有 A 或 B 都为检索命中

A B

Page 7: 信息检索基础知识与信息 检索技巧专题讲座

淘花 / 百度专用 7

-- 逻辑与( * , AND ):表达检索词间的交叉关系。可缩小检索范围,提高查准率。如: A*B ,表明结果必须同时含有 A 和 B 才为命中

-- 逻辑非( - , NOT ):表达检索词间的排除关系。可缩小检索范围,提高查准率,但要慎用。如:A-B ,表明结果是 A 中不包含 B 的那部分

A B

A B

Page 8: 信息检索基础知识与信息 检索技巧专题讲座

淘花 / 百度专用 8

( 二 ) 截词检索: 又称词干检索、模糊检索。检索时,只需用词干

加截词符号,凡是含有与该词干相同的文献均能被检出。该方法能很好避免漏检现象的出现。

检索系统不同,截词符也不同,常用的截词符号有:?, * 等。

分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。

按截断的位置来分,截词可分为后截断、前截断、中截断三种类型。

Page 9: 信息检索基础知识与信息 检索技巧专题讲座

淘花 / 百度专用 9

举例说明 : 后截断,前方一致。如: comput* 表示 computer,computers,computing 等。 王伟? 可查出所有名字中含“王伟”的作者的文献 前截断,后方一致。如: *Computer 表示 minicomputer,microcomputer 等。 中截断,中间一致。如 *comput* 表示 minicomputer,microcomputers 等。 作者 = 张 ? 静 检索出张亚静、张雪静、张宇静等。

Page 10: 信息检索基础知识与信息 检索技巧专题讲座

淘花 / 百度专用 10

(三)限制检索 限制检索是缩小或约束检索结果的方法,主要是指限

定字段检索,即是指定检索词在记录中出现的字段。 常用的字段代码有: TI (题名) AU (作者) AB (文摘) JN (刊名) PY (年代) LA (语种) ……

如: information science/TI LA=english 文摘 = 网络信息资源

Page 11: 信息检索基础知识与信息 检索技巧专题讲座

淘花 / 百度专用 11

四、机检系统常用检索方法 简单检索( basic search ):是一种单项检索。

一般只需输入一个检索词,辅以相应的途径即可进行检索。

二次检索:在原有简单检索的结果基础上,再进行检索。可反复使用,不断扩大或缩小检索范围。

高级检索( advanced search ):是一种多项组合检索,一般输入多个检索词进行组配。有的检索系统也称为复杂检索或扩展检索。

专家检索:用多个检索词与各种运算符组成检索式,功能与高级检索相似。

Page 12: 信息检索基础知识与信息 检索技巧专题讲座

淘花 / 百度专用 12

五、检索技巧 信息检索最重要的两个指标: “ 检全率”与“检准率” 检准率:指检出的相关文献量与检出文献总量 的比率。反应检索结果的准确性。 检全率:指检出的相 关文献量与检索系统中相 关文献总量的比率。反映检索结果的 全面性。

Page 13: 信息检索基础知识与信息 检索技巧专题讲座

淘花 / 百度专用 13

(一)提高检准率的方法 查准率由高到低:题名 > 关键词 > 全文 使用限制检索 如:在百度中可以进行多种限制: 限定搜索网站 (site: );文档格式( filetype:

ppt 、 doc 、 pdf 、 xls 等)。 反复使用二次检索( and ) 使用“精确检索” 如:百度中的“”(双引号)与《》(书名号)

等 维普与 CNKI 中的“精确检索”

Page 14: 信息检索基础知识与信息 检索技巧专题讲座

淘花 / 百度专用 14

(二)提高检全率的方法

查全率由高到低:全文 >关键词 >题名 使用同、近义词( or ) 使用“模糊检索”和“截词检索”等 利用文献后所附“参考文献”进行检索