102
文献检索与利用 维之图书馆 2015年

文献检索与利用 - peihua.cn · 文献检索与利用 维之图书馆 2015年 . 本课程主要介绍与各专业学生密切相 关的各类信息源、信息检索技巧和信

  • Upload
    others

  • View
    33

  • Download
    0

Embed Size (px)

Citation preview

文献检索与利用维之图书馆

2015年

本课程主要介绍与各专业学生密切相关的各类信息源、信息检索技巧和信息利用方法。

1

2 开设本课程的目的在于提升学生的信息素养,具体表现为让学生在搜集使用信息的过程中,拓展信息面,培养信息敏感性,提升信息利用效率,提高信息道德意识。

什么是信息素养?

信息素养是指个人通过生产、生活实践以及接受信息教育而形成的获取、利用信息的意识和综合能力。信息素养是由信息意识、信息知识、信息能力和信息道德4个方面构成。

怎样才能成为具有信息素养的人呢?

信息意识的培养:信息敏感性(习惯养成:多渠道获取信息、信息联系自身需求)

信息知识的积累:信息相关理论和技术(课堂学习、自学、经验积累)

信息能力的培养:获取、加工、利用的能力(在意识、知识基础上,经常解决各类问题)

信息道德提升:不发布,能防范(学校教育,媒体感知、日常经验)

《文检课》如何帮助学生提升信息素养?

《文献检索与利用》作为通识课程,主要帮助学生有效获取信息知识、提高学生信息能力,并在一定程度上培养学生的信息意识和信息道德。

《文检课》主要内容:

文献检索基础知识

三大信息源介绍(纸本、订购数据库、互联网)及检索方法

问题解决(学术资料整理分析、考研创业资料搜集、日常生活问题解决)

关于信息素养的能力标准 扩展资料

2000年1月18日,美国高等教育图书研究协会(ACRL)在召开的美国图书协会仲冬会议上审议并通过了“美国高等教育信息素养能力标准”(Information Literacy Competency Standards for Higher Education)。该标准指出 信息素养是个人“能认识到何时需要信息,和有效地搜索、评估和使用所需信息的能力。”具体可分为五大评估标准、22项执行指标和若干个子项目。

提升了信息素养对我们到底有什么好处?

提升了信息素养对我们到底有什么好处?

毕业论文

学术论文

找工作

终身学习

主要学习参考资料

教材:《信息检索与利用》,洪全主编,人民邮电出版社,2011.8

参考书:《信息检索理论与方法》,陈兰杰主编,中国水利水电出版社,2011.8《现代信息检索》,(西班牙)RicardoBaeza-Yates主编,机械工业出版社,2011.3

网络资源:重师图书馆(http://lib.cqnu.edu.cn)百度(http://www.baidu.com)谷歌(http://www.google.com.hk)中文搜索引擎指南(http://www.sowang.com)狗狗(http://www.gougou.com)

课程性质和学习要求

课程性质:通识必修考核方式:期末考试(60%)+平时成绩

(40%)

闭卷 考勤+作业

检索报告要 求:活 跃

课程纪律(关于考勤)

点名+提问

在事先没有提前通知临时外出者,在点名和提问时未到即判断为缺勤,每堂课缺勤名单由科代表和学习委员(学习委员和班长、科代表和班长)签名确认,在缺勤后确实因重要理由补假条者须由辅导员签字并留辅导员联系电话

第一次缺勤不扣分,第二次扣10分,第三次扣20,第四次扣40……

平时成绩管理办法

平时成绩主要由平时作业构成

课堂积极回答问题会适当加分

协助管理课堂,协助实习适当加分

迟到、扰乱课堂纪律适当扣分

缺勤者按规定扣分

课前试一试

1、朋友想找一首歌,好像歌词里有“我发过誓,想要把你忘记,可是我就是不争气,你的影子总是挥不去”,请帮忙找到这首歌的完整歌词。

2、最近我在互联网上查到一篇名叫“Web2.0网站微内容质量控制机制初探”or“《云计算解码》:云计算是破坏性的创新”的文章,感觉很有用,但网上都需要我注册付费才能看到全文,有什么办法能让我免费看到全文呢?

3、美国的DIALOG系统是目前世界上最大的国际联机情报检索系统,存储有三亿三千万篇文献记录,占世界各检索系统数据库文献总量的一半以上。DIALOG为方便用户学会使用该系统,在www.dialog.com网站提供免费的试用账户和密码,可以用该账户登陆www.dialogweb.com网站进行检索练习。请找到可以使用的账户和密码,并登陆dialogweb。

第一章 绪论

1 基本概念

1.1 信息

信 息 一 词 在 中 国 历 史 文 献 中 最 早 见 于南唐诗人李中《暮春怀故人》中的“梦断美人沉信息,目穿长路倚楼台”中

“信息是能够用来消除不确定性的东西”。(信息论创始人申农 美国 1928 国外最早)

信息是物质、能量、信息及其属性的标示。(医)

信息本质是概述能量本身,表现能量的差别,本身也是能量的一种。(哲学)

第一章 绪论

情报学关于信息的定义

信息不是事物本身,不是某种实体,而是事物存在或变化过程中产生的,如数据、新闻、认识、事实、内容、消息等,是物质存在的方式、形态或运动状态的反映。(P3)

信息的要义:(帮助理解)

①不是事物本身,不是某种实体;

②是物质存在方式的反映;

③可以消除事物的不确定性;

④信息不一定有用。

分类:自然信息、社会信息

第一章 绪论

1.2 知识

概念:知识是人类通过信息对自然界、人类社会及思维方式与运动规律的认识与概括,是人的大脑通过思维重新组合和系统化了的信息,是信息中最有价值的部分。

1.3 情报

概念:情报就是为了解决一个特定问题从一定文献资料中提取或经过传递获得的知识。

三个基本属性:知识性、传递性、针对性

信息>知识>情报

第一章 绪论

1.4 文献

“献者,贤也;文者,典籍也”——朱熹《四书章句集注》。

GB:记录有知识的一切载体。

由知识内容、信息符号、载体材料和记录方式四个不可分割的基本要素构成。

知识必须依附于一定的载体,如存在于人的大脑中或固化在一定的物质载体上。

第一章 绪论

2 信息资源类型

2.1 按文献载体划分

印刷型(printed form)

缩微型(micro form)

视听型(声像型)(audio-visual form)

电子型(机读型)(electronic form )

第一章 绪论

2.2 按文献级次划分

零次文献:非正式出版物或非正式渠道交流的最原始的文献。如:手稿、个人通信、原始记录等。

正式出版物

图书:ISBN

报刊:ISSN

(CN)

非正式出版物

图书:教材交流

报刊:内部交流

不等于非法要申请获得准印证,不以盈利为目的,无

广告

中国新闻出版总署:http://www.gapp.gov.cn

第一章 绪论

一次文献:原始文献,指直接从研究或劳动实践中产生并经过适当的审查后正式发表公布的文献。如期刊论文,科技报告,专利说明书,会议论文,学位论文等。为文献检索的目的。

二次文献:按一定的方法对一次文献进行整理加工,提取一次文献的内外部特征,以使之有序化而形成的线索性文献。包括目录、题录、索引、摘要等等。是检索一次文献的工具。

(全国报刊索引:http://www.cnbksy.com.cn

全国新书目:http://www.qikan.com)

第一章 绪论

三次文献:综述性文献,指对一次文献和二次文献进行综合、分析、评述等深度加工形成的文献。如学科进展综述、专题述评、预测报告,以及一些百科全书、年鉴、数据手册、词典等。

(中国大百科全书:http://www.ecph.com.cn)

小资料

按照颜色划分文献:白色文献、灰色文献、黑色文献

第一章 绪论

各级文献级次比较级次 是否公开出版 有无完整内容 内容特点

零次文献 未公开 有 兼而有之

一次文献 公开 有 专而深

二次文献 公开 无

三次文献 公开 有 广而精

想一想:能否判断你在生活中接触到电子文献的文献级次?

第一章 绪论

2.3 按文献的出版形式划分

1.图书

2.连续出版物(期刊和报纸)

3.会议文献

4.学位论文

5.科技报告(PB、AD、NASA、DOE)

6.专利文献

7.标准文献

8.政府出版物

9.产品样本

10.技术档案

第一章 绪论

2.3.1 图书

图书的分类:专著、教科书、丛书、工具书

图书的身份标识:ISBN(International Standard Book Number)国际标准书号

ISBN的组成:EAN·UCC前缀、组号、出版社号、书序号、校验位

ISBN示例:978-7-115-25706-2

小资料

EAN·UCC前缀是由国际EAN·UCC产品编码系统提供的3位数字,由国际ISBN中心向国际EAN组织申请获得。 EAN(欧洲物品编码协会 ) UCC(美国“统一代码委员会” )

第一章 绪论

2.3.2 连续出版物

分类:期刊和报纸

身份标识:ISSN(International Standard Serial Number)国际连续出版物编号

示例:ISSN 1000-7490 (情报理论与实践)

如何辨别非法出版物?

该到哪里约会?

小红某日经过家门口时突然看见自己家的信箱里有一封信,由于平时工作太忙,早出晚归的,看样子这封信在这里放了很久了,信封已经被雨水打湿,寄件人地址和姓名已经模糊不清了,隐隐约约的看到邮编为4320**。小红急忙拆开一看,信纸也是惨不忍睹,她费劲的读了一下,大致内容是:“7月7日上午11点……董永故里……曾发现珍稀的古植物化石的森林公园……等你,不见不散!”小红经过一番查询之后终于明白了,如期赴约。

谁是关键词广告的先驱?

ADwords(关键词广告)是目前搜索引擎行业的重要商业模式,当用户利用某一关键词进行检索,在检索结果页面会出现与该关键词相关的广告内容,请问最先使用该模式的是谁?

网购图书,谁的最便宜?

完全不记得歌词的歌

小梅有天在街上逛的时候,无意中听到一首歌,

觉得非常好听,等回家想查的时候,却一句歌词也记不住了,

只能哼哼小段旋律,你能想办法帮她找到她想听的歌吗?

本故事纯属虚构,不可较真……

重庆主城区的一名富翁家财万贯,一些不法之徒随即看上了他。端午节那天,富翁老婆给他打电话让他早点回家吃粽子,在回家的路上富翁突然被黑布蒙上了眼睛,顿时失去了知觉。等他醒来时发现自己在一辆很大的吉普车里面,手脚被绑,嘴巴也被封严了。只听见前面的歹徒说:“咱们过了前面的保戛,就能到达孔马了”。可能药劲没过,不一会儿富翁又睡着了,等他醒来时发现车已经停下了。只听到车外面吵吵嚷嚷,很多人在吆喝“卖粽子罗”。几个歹徒说“跑了这么多天了,哥几个也休息一下吧!”趁歹徒下车吃东西,富翁挣脱了绳索,来到了驾驶室。快速的发动汽车,随着马达的轰鸣富翁终于逃离了歹徒的视野。你知道富翁总共被绑架了多少天吗?

第二章 文献检索基础知识

1 文献信息利用

1.1 什么叫“文献信息利用”指把文献信息按一定规则进行标引和存贮后,再根据用户的需要按一定的步骤、方法、工具对其进行检索,并利用检索所得资料进行文献再生的全过程。包括信息组织、信息检索、信息再生三个过程。

第二章 文献检索基础知识

1.2 文献信息利用示意图(P12)

语言 规则

结果输出

信息再生

用户

信息加工者

提问档

标引记录特征信息

控制

提问

检索工具(资源库)

第二章 文献检索基础知识

1.3 文献检索(信息检索)解读(P11)

从广义角度讲,文献检索,是指把文献按一定方式组织和存储起来,并针对用户的需求找出所需文献的过程,亦称信息检索,包含信息组织和信息检索两个过程。

从狭义角度讲,文献检索仅指信息检索,文献的查找过程。

口语中的文献检索一般为狭义。

第二章 文献检索基础知识

1.4 信息检索分类

文献检索(全文检索):以全文资源库为检索对象,目的是获取全文阅读CNKI期刊数据库、超星图书

数据检索:以数据资源库为检索对象,目的是获取具体数据统计年鉴、CNKI数字检索

事实检索:以事实资源库为检索对象,目的是获取某一具体事实百科全书、CNKI定义搜索

第二章 文献检索基础知识

2 信息“控制”(参见P12过程示意图)

信息控制的意义

对信息加工者:规范

对信息检索者:引导

信息控制的分类

规则控制:

纸质文献:《文献著录总则》

数字文献:《都柏林核心集》

语言控制:

分类语言:《中图法》

主题语言:《汉语主题词表》

第二章 文献检索基础知识

2.1 规则控制

纸质文献信息描述内容(参见P14《文献著录总则》)

在版编目数据(参见P15-17)

数字文献信息描述内容(参见P15《都柏林核心集》)

对数字文献进行信息描述的检索意义在搜索引擎中,大多描述项目都对应有相应的检索语法,可以节约用户的检索时间,提高检索质量

描述项与对应的语法

题名 intitle:关键词(反:intext:关键词)

作者 author:网名

主题 subject:主题词(google:insubject)

格式 filetype:扩展名 内容关键词

资源标识 inurl:url特征词 内容关键词;site:域名;related:url

关联 link:域名

权限管理 如何复制不可复制的网页内容

禁止复制保存的文字可采用以下方法

另存的时候保存类型改为“仅HTML”或者“文本文件”

使用Frongtpage或Word编辑网页再复制文字

查看源文件,复制其中的文字

使用Frongtpage或Word编辑网页,修改其中的禁止复制语句,再保存网页可复制(此法较难,需熟悉编程)

截图(登陆qq,使用快捷键CRTL+ALT+A截图,或者直接使用键盘上的PrintScreen键截图)

2.2 语言控制

检索语言的概念:是文献检索中用来描述文献特征和表达信息提问的一种专门化的人工语言,是信息组织和文献检索共同使用的语言,是联系信息组织人员和用户的桥梁。

检索语言的分类:分类语言和主题语言

分类语言和主题语言的区别

分类语言按事物的学科属性或知识属性集中,主题语言按特定的事物、问题、现象,即以主题为中心集中。

示例:茶种植 茶焙制 茶贸易分类:S(农业) T(工业) F(经济) 主题:均为茶类

分类语言是用字母、数字、标点等基本字符组成分类号,用以表达文献主题概念的检索语言。(G252.7)

2.2.1 分类语言

我国分类语言发展简史

西汉 刘 向 《别录》 我国第一部图书目录

西汉 刘 歆 《七略》 七分法 (辑略、六艺略、诸子略、诗赋略、兵书略、术数略、方技略)(我国第一部图书分类法)

宋 郑 樵 《通志.艺文略》 十二类

西晋 荀 勖 《中经新簿 》四分法(甲乙丙丁)

东晋 李 充 《四部目录》 四分法(甲乙丙丁)

清 纪 昀 《四库全书》 四分法(经史子集)(我国古代最为成熟的分类法)

第二章 文献检索基础知识

2.2.1 分类语言

国外著名分类法介绍

杜威十进分类法 (Dewey Decimal Classification,DDC)(是当今世界上影响最大、用户最多的图书馆分类法,至今已出版22版,2003年出了电子版)

国际十进分类法(Universal Decimal Classification,UDC)

美国国会图书馆图书分类法 (Library of Congress Classification,LCC)

十进分类思想

2.2.1 分类语言

《中图法》简称《中图法》,是我国建国后编制出版的一部具有代表性的大型综合性分类法,英译名为Chinese Library Classification,CLC。至今已出版4版,全国90%以上的图书情报机构使用该分类法。是层层展开的类目体系,共分马列毛、哲学、社会科学、自然科学、综合性图书5大部类,并细分为22个基本大类。

A 马列主义、毛泽东思想、邓小平理论

B 哲学、宗教

C 社会科学总论

D 政治、法律

E 军事

F 经济

G 文化、科学、教育、体育

H 语言、文字

I 文学

J 艺术

K 历史、地理

社会科学

马列毛

哲学

N 自然科学总论

O 数理科学和化学

P 天文学、地球科学

Q 生物科学

R 医药、卫生

S 农业科学

T 工业技术

U 交通运输

V 航空、航天

X 环境科学、安全科学

Z 综合性图书

自然科学

综合性图书

T 工业技术类目简表

TB 一般工业技术

TD 矿业工程

TE 石油、天然气工业

TF 冶金工业

TG 金属学与金属工艺

TH 机械、仪表工业

TJ 武器工业

TK 能源与动力工程

TL 原子能技术

TM 电工技术

TN 无线电电子学、电信技术

TP 自动化技术、计算机技术

TQ 化学工业

TS 轻工业、手工业

TU 建筑科学

TV 水利工程

其中“工业技术”是一个庞大的体系,文献量巨大,因此采用双字母展开为16个二级类,其重要程度不亚于基本大类;

社会科学大体按“上层建筑→经济基础→意识形态”的次序排列;

自然科学大类按一般到特殊、低级到高级、理论到应用次序排列。形成了“基础理论/技术科学/应用科学”三个层次。

分类练习

依据《中图法》把以下图书归入相应大类:

《英语语法》

《射雕英雄传》

《电视接收机的维修》

《全国计算机等级考试》

《朝鲜核问题研究》

《西欧著名音乐家评传》

《气功疗法》

《美国律师制度》

《美学原理》

《庄子解》

现代信息检索教程 孙济庆; 葛巧珍; 曾瑗

索书号: G252.7 / 0216

分类号 种次号

《中图法》 该类书到馆顺序号

类、种、册的区别

什么是“索书号”?

类、种、册的区别

类:根据《中图法》分在同一个类号下面的书称为同一类书。

种:拥有独立的ISBN号(索书号)的书称为一种书。

册:一种书可以印刷多册。

基于《中图法》的图书排架--索书号排序

先比较分类号

大类按英文字母顺序排列

大类相同的则从左至右顺次比较数字大小,小的排前,大的排后(没有<“-”<0^9,小圆点(.)为辅助符号,不参与比较)

分类号相同的则按种次号的大小顺序排列,小的排前,大的排后

图书排架练习

根据《中图法》对以下图书进行排架

B7-1

034

B703

0126

B8

01

F0

01

B693-4

025

B703

055

B693.4

025

① ② ③ ⑤ ⑥④ ⑦

基于《中图法》的图书排架--架位安排

架位排列是按英文字母顺序从A、B、C、D………..Z依次排架。

管理员面对书架从左手起架,从左到右,从上到下,按索书号从小到大依次进行。

第一排书架与第二排书架之间呈“S”型迂回绕架连接。(就近原则)

2.2.2 主题语言

什么是“主题词”

广义:所有揭示文献主要意旨的词,包括标题词、元词、叙词、关键词

狭义:仅指叙词

一般文献或口语中提到的主题词均为:叙词

什么是叙词?国内亦称作主题词,是经过规范化处理的,以基本概念为基础的表达文献主题的词和词组。

什么是关键词?

什么是关键词?关键词是直接选用文献中的自然语言作基本词汇,并将那些能够揭示文献题名或主要意旨的关键性自然语词作为关键词进行标引的一种检索语言。

主题词产生的原因事物的多指称性,决定了描述的不统一性,从而带来检索的低检全率

主题词产生的原因

电脑文献A:电脑常见问题解答

文献C:计算机常见故障解答

小资料

FAQ:Frequently Asked Questions

文献B:Computer FAQ

主题词和关键词的区别

主题词和关键词的区别

共同点:

都是用来表示文献主题内容的词和词组

不同点:

主题词是先产生规范主题词表,如《汉语主题词表》,再根据文献内容从词表里选词揭示文献主题,不一定是文献原文所使用过的词汇。

关键词是自然语词,是直接选用文献原文中使用过的词汇揭示文献主题。

3 方法、途径、程序和效果评价

3.1 文献检索方法

常用法:

顺查法:以所查课题起始年代为起点由远而近地按时间顺序的查找方法。(文献齐全、费时)

倒查法:由近而远逆时间顺序的查找方法。(可能漏查,省时省力)

抽查法:抓住课题研究发展迅速,出版文献较多的年代,抽取时间段或时间点进行顺查。(可能漏查,省时省力)

顺查法、倒查法、抽查法

3.1 文献检索方法

追溯法从已有的文献后列的参考文献着手,逐一追查原文,再从这些原文后所附的参考文献逐一检索,获得一批相关文献的方法。(简单方便、可能漏检误检)

什么是参考文献?在撰写论文或著作过程中引用了他人的研究成果,一般在文尾按照一定的格式说明被引用文献的出处。引用的文献称为“引证文献”,被引用的文献称为“参考文献”。

文献关系图

A

B

D

E

C

二级参考文献

二级引证文献

引证文献

参考文献

相似文献

共引文献

同被引文献

循环法:是常用法和追溯法的结合使用

在检索工具书刊比较丰富的条件下,可以利用常用法;在获得针对性很强文献的条件下即可利用追溯法获得相关性较强的文献;获悉研究课出版文献较多的年代即可利用抽查法

3.2 文献检索途径

外部特征途径:题名、著者、序号、出版发行

内容特征途径:分类、主题

其他途径:时序、地序、分子式

图书的常用四大检索点(检索途径、检索入口、检索项):书名、作者、主题词、分类号

3.3 文献检索程序

1 分析待查项目、明确主题概念

2 选择检索工具

3 确定检索途径和检索标识

4 查找文献线索、索取原文

5 评估检索结果以及检索策略的调整

1 分析待查项目,明确主题概念

1.1 信息需求分析

1.2 课题主题分析

1.1 信息需求分析

价值:有助于确定检索工具和检索途径

信息需求类型:

(1)了解学科发展动态的要求:新

(2)了解某一研究主题的片段性信息:准

(3)了解某一研究主题的全面性信息:全

(4)检索特定的文献信息:条件

需求分析案例

(1)请查杨新民教授2000年至今共发文多少

(2)解释“基于课堂交往的教学方式变革”中的“课堂交往”

课题一:GIS云计算的理论与方法

要求:(1)认真查阅资料,了解课题基本动态;

(2)从专业期刊入手,了解本课题的国内外研究状况

课题二:GIS在城市生态服务功能中的应用

要求:(1)文献综述:城市化进程中对城市生态的影响

(2)GIS在解决及预测城市生态问题中的功能

(3)目前主要的流派及各自侧重的方面

1.2 课题主题分析

价值:有助于确定检索标识

课题主题分析的一般步骤:

(1)一般概念分析:根据课题陈述提取主要概念,并根据具体情况分析出上位概念、下位概念、左右关系概念(影响因素)

(2)隐含概念分析:从课题所属专业角度作深入分析,提取同义词、近似词、专指词、约定俗成词

(3)进行概念组配:挑出核心概念组面,按优劣顺序排序,去掉无关或意义不大的概念组面。

课题主题分析案例

基于课堂交往的教学方式变革

教学方式 课堂交往

“教学方式”的上下左右关系

教学方式

单主体教学方式

教师素质

学生水平

办学理念

教学条件

学习

教育

教学

讲授法

在线教学

CAI

双主体教学方式

互联网

计算机

教学目的

教育技术

校园2.0

民族文化

体系内体系外

体系内

体系内

“课堂交往”的上下左右关系

课堂交往

课堂交往质量

交往频率

交往理论水平

社交经验

人际交往

社会交往

生生交往

并行式交互

师生交往

串行式交互

教师素质

学生水平

交往机会师生心理

教学时间

体系内体系外

体系内

体系内

分组讨论、讲授、问答

教学环境

民族文化

为什么分析上下左右的关系?

分析上是为了,用上层的理论方法,向下应用到我当前正在研究的层级

分析下是为了归纳总结下层的理论方法、实践经验、研究经验,以形成更为一般的,适应性更广的理论,更符合我当前研究的级别。

分析左右是为了,查找影响因子,为形成当前研究级别的问题解决策略提供依据,以及借用其他学科研究方法,研究当前学科领域的课题。

隐含概念分析

教学方式:教学方法、教学策略、教学形式、教学手段;教学组织、教学设计、教学艺术

课堂交往:课堂交互、课堂交流、课堂互动、课堂信息交换

2 选择检索工具

选择工具的前提:了解众多信息源,熟悉各信息源的检索方法和技巧

选择工具的方法:根据信息需求分析结果判断文献的可能分布,选择相应的检索工具

三大信息源

互联网资源

校内数据库

纸质文献

纸质文献

纸质文献类型

图书

期刊

报纸

工具书

检索方法和技巧

基于《中图法》的文献分类

基于《中图法》的文献排架

书刊查询系统的检索技巧

校内数据库

检索方法

一般检索

高级检索

分类检索

期刊导航

布尔检索

专业检索

数据库名称

国外博硕论文

数图外文数据库、CNKI、维普期刊、

万方数据、 超星、书生、圣典E-book

互联网资源

网络资源类型:

搜索引擎:综合搜索引擎、专业搜索引擎

门户网站:综合门户、专业门户

其他资源:新闻、博客、空间、论坛、即时通信、百科、问答平台(人肉)

检索方法和技巧:

一般搜索

高级搜索

站内搜索

二次搜索

语法搜索

特色产品

3 确定检索途径和检索标识

检索途径也叫检索项、检索点、检索入口,是检索工具根据文献的内外部特征确定的

确定途径的方法:

(1)知道需求文献的外部特征:按相应特征途径检索(按条件查找)

(2)知道需求文献的内容特征:按篇名、关键词、摘要、主题、分类、全文、期刊导航等方式检索(“新”、“准”、“全”的信

息需求一般按此法检索,使用此法获得了核心文献、核心作者、核心研究机构等信息后,也可按条件继续检索文献。)

确定检索标识的方法:已知条件的,标识为条件信息;只知课题方向的则根据课题主题分析结果确定检索标识,按组面的优劣顺序进行检索

4 查找文献线索,索取原文

纸质文献可以直接借阅(不能外借的可在馆内复印)

校内数据库资源一般支持全文免费下载

互联网资源能直接复制保存的可直接复制到Word文档里或另存到本地硬盘。

禁止复制保存的文字可采用以下方法:

(1)另存的时候保存类型改为“仅HTML”或者“文本文件”

(2)使用Frongtpage或Word编辑网页再复制文字

(3)查看源文件,复制其中的文字

(4)使用Frongtpage或Word编辑网页,修改其中的禁止复制语句,再保存网页可复制(此法较难,需熟悉编程)

(5)截图(登陆qq,使用快捷键CRTL+ALT+A截图,或者直接使用键盘上的PrintScreen键截图)

很多文章阅读前需安装相应的阅读器(如CAJ格式需安装CAJviewer,PDF格式需安装Adobe Reader,其他格式可直接上网搜索其对应的阅读器)

学会做电子文章笔记(包括画重点线、做注释、文字识别等)

5 评估检索结果以及检索策略的调整

扩检:一般将设置的检索范围太小,命中文献不多,需要扩大检索范围的方法称之为扩检。

缩检:一般将设置的检索范围太大,命中文献太多,需要缩小检索范围的方法称之为缩检。

P54

扩检:原检索范围小,命中文献少

缩检:原检索范围大,命中文献多

扩检的方法

(1)检少与运算符,增加同义词和同族相关词,使用逻辑或相连

(2)在词干相同的单词后使用截词符

(3)去除已有的字段限制和位置运算符

缩检的方法

(1)减少同义词和同族相关词的使用,使 用专业术语

(2)增加限制概念,用逻辑与相连

(3)使用字段限制

(4)使用适当的位置算符

(5)使用逻辑非,排除无关概念

分析网络信息检索中的扩检与缩检

关键词角度

结果输出角度

缩检

关键词角度

语法角度

结果输出角度

语法角度

扩检

网络信息检索中的扩检

关键词角度:

1 使用同义词、同族相关词

2 使用上位概念

3 站在作者的角度选取关键词

语法角度:

1 逻辑或

2 link、related

3 截词检索

结果输出角度:

时间、语种、区域、文件格式、关键词出现位置都不设置限制

网络信息检索中的缩检

关键词角度:

1 使用专业术语

2 使用下位概念

语法角度:

1 逻辑与、逻辑非

2 site、inurl、intitle、intext、filetype、define

3 精确搜索(“” 《》)

4 二次搜索

结果输出角度:

时间、语种、区域、文件格式、关键词出现位置都可以进行限制

3.4 检索效果的评价

检全率:亦称查全率、命中率、召回率等,指系统实施检索时检出的与某一检索提问相关的信息资源数与检索系统中与该提问相关的实有信息资源总数之比检全率=检出相关信息资源量/系统相关信息资源量*100%

检准率:亦称查准率、相关率、检索精度,指系统实施检索时检出的与某一检索提问相关的信息资源数与检出的信息资源总数之比检准率=检出相关信息资源量/检出信息总量*100%

计算练习

百度搜索引擎号称总资源量为100亿,假设百度数据库中与“神秘主义”有关的资源为20万,用关键词“神秘主义”进行查询,报告结果为4,060,000条,但用户实际能看到的只有800条,又经用户仔细分析后,只找到了150条有价值的结果。请计算本次检索的检全率和检准率。

第三章 计算机信息检索基础知识

基本检索技术:布尔检索及逻辑组配

包含词汇A和包含词汇B的文献在数据库中可能分布图

某数据库

包含词汇B的文献集合包含词汇A的文献

结合

1 2 3

4

第一节 计算机检索的定义及特点

一、计算机检索的定义 计算机信息检索就是将大量的文献资料或数据进行加工

整理,按一定格式存贮在机读载体上,建成机读数据库,利用计算机对机读型数据库进行检索的信息检索方式。

二、计算机检索的特点 分散与无序 语言种类 应用领域广泛 实时性 操作简便 速度

第二节 联机检索

一、联机检索定义及系统

联机检索是指用户利用终端设备,通过国际(卫星)通讯网络,与世界上任何国家的大型计算机检索系统的主机联结,从而检索世界各国存储在计算机数据库中的信息资料。

第二节 联机检索

第二节 联机检索

二、联机检索数据库的特点

内容上

规模上

时间上

规范上

第二节 联机检索

三、联机检索服务方式

回溯检索

定题检索

联机订购

电子邮件

光盘服务

第二节 联机检索

四、国内外联机数据库概况

DIALOG

ORBIT

ESA/IRS

BRS

中国科技信息研究所ISTIC ORS系统

北京文献服务处BDSIRS系统

原化工部科技情报研究所CHOICE系统

原机电部科技情报所MEIRS系统

上海科技情报研究所ISTIS ORS系统

等等

第四章 网络信息检索

对网络资源的认识

分类:可见资源和不可见资源。

可见资源:有HTML超链接,没有设置口令

不可见资源:无超链接、局域网资源、有口令的资源

可见资源与不可见资源的比例约为1:3

不可见资源搜索引擎

不要迷信某一个搜索引擎

搜索引擎不能搜索互联网上的所有资源

搜索引擎不是即时搜索互联网,而是搜索索引数据库

深网资源

深网资源:用来表述哪些将信息内容存储在检索数据库中而仅仅响应直接查询提问的网站。(不能通过链接访问)

深网资源形式:未被链接的网页、动态网页、网上可检索的数据库、实时数据、部分非网页文件、需密码和注册才能访问的网站、超过网络蜘蛛爬行范围以外的网页、网页拥有者故意采用堵塞技术禁止索引的网页等。

deep web 相对于 surface web 而言:数量大(400-500倍)、质量高、访问量高、增长速度快、总体覆盖面广和单体专指性强、大多可免费获取)

深网搜索引擎

谷歌学术搜索:scholar.google.com.hk

about深网搜:websearch.about.com/od/invisibleweb/a/invisible_web.htm

brightplanet:www.brightplanet.com

盛语搜索网:www.shengso.com

findarcticles:www.findarticles.com

专业图书馆员组织的信息资源:www.ipl.org

认识地址为语法检索打基础

IP地址:(Internet Protocol)互联网协议地址,为了保证每台入网的计算机在通信时能相互识别,每台计算机都会分配一个由4字节共32位的数字串组成,每个字节的取值范围为0-255。(定位每台上网的计算机)举例:重师主页(219.153.130.76)

IP地址查询:

www.ip138.com

www.123cha.com

www.whatchina.com

www.nciic.com.cn(全国身份证号码查询)

DN:域名

DN:Domain Name 定位服务器,一般由2段以上的字符组成。 域名结构一般为:主机名.机构名.二级域名.顶级域名

举例:dict.cnwww.baidu.comwww.sina.com.cn

顶级域和二级域的分类(P62)

相关语法:site、link、related

URL:统一资源管理器

RUL:uniform resource locator,定位服务器上的具体资源的位置。

格式:协议://域名(IP):[端口]/路径/文件(文件名.文件格式)

举例:http://websearch.about.com/od/invisibleweb/a/invisible_web.htm

相关语法:inurl

搜索引擎

搜索引擎:就是人们对网上各种信息资源进行标引和检索的一种工具,它是一种能够通过Internet接受用户的检索标识,并向用户返回符合其检索要求的信息资源网址的网站。

按信息搜集方法和服务提供方式,可分为:

目录式搜索引擎:http://dir.iask.comhttp://www.opendirectory.org/

机器人搜索引擎

元搜索引擎:www.dogpile.com搜魅网(http://site.someta.cn/),综合了百度、谷歌、搜狗、中搜等搜索结果。

注意事项

1.使用百度搜藏时,须先到百度搜藏帮助里安装注册文件,然后重启浏览器后,则直接可以使用右键搜藏,如果使用其他浏览器不成功,则最好换成IE.

如何确定选题意向

1、借用已有选题:所在专业的各级别项目基金申报指南提供的申报方向,从大方向中选个小课题进行研究;借用类似挑战杯、学生项目基金中的已有选题,改变研究范围,研究领域。

2、从专业热点中选题:从CNKI、维普中分析最近几年内的文献篇名,从中总结研究热点,选热点中有价值但未解决的问题进行研究;从专业学术会议中发现热点问题(国际、国内、省市);从各种媒体及专业学术网站中发现热点

3、从生活实际中选题:从自己所观察到的生活、学习、工作中发现的教育、社会中的迫切问题、争鸣现象,评估己身实力,寻一突破口进行选题。不一定关乎本专业。