Upload
caesar-kline
View
67
Download
0
Embed Size (px)
DESCRIPTION
信息检索基础知识与信息 检索技巧专题讲座. 天津商学院图书馆 吴凤玉 E-mail : [email protected] 电话: 26684017. 淘花 / 百度专用. 1. 一、信息检索. 信息检索是将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术 。 对于信息用户而言,就是从信息集合中找出所需信息的过程。 信息检索基本原理: 提问标识(检索式)与文献标识的对比. 淘花 / 百度专用. 2. 二、信息检索途径. 检索途径: 又称为检索点。 依据文献的 外部特征 (题名、责任者、 出版者、出版时间等) - PowerPoint PPT Presentation
Citation preview
淘花 / 百度专用 2
一、信息检索
信息检索是将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。
对于信息用户而言,就是从信息集合中找出所需信息的过程。
信息检索基本原理: 提问标识(检索式)与文献标识的对比
淘花 / 百度专用 3
二、信息检索途径 检索途径: 又称为检索点。 依据文献的外部特征(题名、责任者、 出版者、出版时间等) 和内容特征(分类号、主题词、关键词 或自由词等)来确定,是信息检索的入口点。
淘花 / 百度专用 4
常用检索途径 题名(篇名)途径:利用篇名中的字词或篇名
的一部分进行检索。其结果是所有在篇名中出现该字、该词或该部分的文章。
著者途径:利用文献作者名字进行检索。可查到该作者的所有文献。
分类途径:利用分类名和分类号进行检索。其结果是该类目所有的文献。
淘花 / 百度专用 5
主题途径:利用与该篇文献主题相关的规范词(主题词)进行检索,其结果是包含该主题词的所有文献。
关键词途径:利用与该篇文献主题相关的关键词(自由词)进行检索,其结果是包含该关键词的所有文献。
序号途径:利用文献的各种代码、数字编制的索引查找文献,如专利号、技术标准的标准号、科技报告的报告号等。
其他途径:如文献类型、参考文献、语种、出版(发表)年份、作者机构、出版机构等。
淘花 / 百度专用 6
三、信息检索常用方法( 一 ) 布尔逻辑: 用布尔逻辑算符来表达检索词间的逻辑组配关系,
是最基本、最常用的检索技术。 -- 逻辑或( + , OR ):表达检索词间的并
列关系。可扩大检索范围,提高查全率。如: A+B ,表明结果中含有 A 或 B 都为检索命中
A B
淘花 / 百度专用 7
-- 逻辑与( * , AND ):表达检索词间的交叉关系。可缩小检索范围,提高查准率。如: A*B ,表明结果必须同时含有 A 和 B 才为命中
-- 逻辑非( - , NOT ):表达检索词间的排除关系。可缩小检索范围,提高查准率,但要慎用。如:A-B ,表明结果是 A 中不包含 B 的那部分
A B
A B
淘花 / 百度专用 8
( 二 ) 截词检索: 又称词干检索、模糊检索。检索时,只需用词干
加截词符号,凡是含有与该词干相同的文献均能被检出。该方法能很好避免漏检现象的出现。
检索系统不同,截词符也不同,常用的截词符号有:?, * 等。
分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。
按截断的位置来分,截词可分为后截断、前截断、中截断三种类型。
淘花 / 百度专用 9
举例说明 : 后截断,前方一致。如: comput* 表示 computer,computers,computing 等。 王伟? 可查出所有名字中含“王伟”的作者的文献 前截断,后方一致。如: *Computer 表示 minicomputer,microcomputer 等。 中截断,中间一致。如 *comput* 表示 minicomputer,microcomputers 等。 作者 = 张 ? 静 检索出张亚静、张雪静、张宇静等。
淘花 / 百度专用 10
(三)限制检索 限制检索是缩小或约束检索结果的方法,主要是指限
定字段检索,即是指定检索词在记录中出现的字段。 常用的字段代码有: TI (题名) AU (作者) AB (文摘) JN (刊名) PY (年代) LA (语种) ……
如: information science/TI LA=english 文摘 = 网络信息资源
淘花 / 百度专用 11
四、机检系统常用检索方法 简单检索( basic search ):是一种单项检索。
一般只需输入一个检索词,辅以相应的途径即可进行检索。
二次检索:在原有简单检索的结果基础上,再进行检索。可反复使用,不断扩大或缩小检索范围。
高级检索( advanced search ):是一种多项组合检索,一般输入多个检索词进行组配。有的检索系统也称为复杂检索或扩展检索。
专家检索:用多个检索词与各种运算符组成检索式,功能与高级检索相似。
淘花 / 百度专用 12
五、检索技巧 信息检索最重要的两个指标: “ 检全率”与“检准率” 检准率:指检出的相关文献量与检出文献总量 的比率。反应检索结果的准确性。 检全率:指检出的相 关文献量与检索系统中相 关文献总量的比率。反映检索结果的 全面性。
淘花 / 百度专用 13
(一)提高检准率的方法 查准率由高到低:题名 > 关键词 > 全文 使用限制检索 如:在百度中可以进行多种限制: 限定搜索网站 (site: );文档格式( filetype:
ppt 、 doc 、 pdf 、 xls 等)。 反复使用二次检索( and ) 使用“精确检索” 如:百度中的“”(双引号)与《》(书名号)
等 维普与 CNKI 中的“精确检索”
淘花 / 百度专用 14
(二)提高检全率的方法
查全率由高到低:全文 >关键词 >题名 使用同、近义词( or ) 使用“模糊检索”和“截词检索”等 利用文献后所附“参考文献”进行检索