Upload
others
View
16
Download
0
Embed Size (px)
Citation preview
信息检索
第四讲 主题概念分析及维普、万方的使用
本讲要求:
初步掌握对主题概念的分析,
学会维普、万方数据库的检索方法。
主题概念的分析
对检索课题进行分析,分析出课
题涉及的事物名称,尤其是所包含的
主题概念,这个过程我们就叫提炼主
题词或是关键词。
Ë 主题分析过程:
Ë 用户进行主题分析的过程实质上是如何准确确定检索词的过程。
Ë 检索词:是指那些出现在文献的标题(篇名、章节名)以至摘要、正文中,对表征文献主题内容具有实质意义的语词,亦即对揭示和描述文献主题内容来说是重要的、带关性的那些语词。
Ë 明确要找什么 根据背景找词 根据反馈调整
审读
提炼
取舍
主题概念
自动 智能 定时 浇花 滴灌 家庭 家用
把主题概念变成检索词
Ë拆分主题概念到最小词语单元
Ë分析各词语之间的逻辑关系、所属层次、与中心主题之间的关系
Ë列出一组通用检索式
Ë具体检索操作时,根据信息源的不同选择合适的检索词、检索入口,并根据检索结果的满意与否不断调整自己的检索策略
检索词的选择应特别注意同义词
① 立足规范词,兼顾自由词
② 词的全称、简称及缩写字母
③ 注意外来词的译写变化
必要时使用上下位词
慎用词组和短语
切记:同义词是文献检索中的永恒难题!
8
如何查找同义词?
Ë利用搜索引擎
Ë利用“重庆维普”中心网站的高级检索
Ë利用CNKI的知识元
Ë利用工具书
Ë预检索,或在检索过程中逐步确定
胶粘剂 9370 粘固剂 265
粘合剂 5291 胶结剂 141
粘结剂 3850 粘胶剂 122
粘接剂 1109 粘着剂 102
黏合剂 603 胶合剂 88
胶黏剂 519 粘附剂 75
10
中国专利库 期刊库
乙型病毒性肝炎 31 1939 乙型肝炎 716 32505 乙肝 783 18416
脱氧核糖核酸 213 1992 DNA 7111 87202 DNA 1268 87202
11
地名: Texas —— 得克萨斯, 德克萨斯
California —— 加利福尼亚, 加里福尼亚
San Francisco —— 圣弗朗西斯科, 三藩, 旧金山
其他: danning —— 单宁, 丹宁
formalin —— 福尔马林, 福马林, 甲醛
aspirin —— 阿斯匹林, 阿司匹林, 乙酰水杨酸
12
静电纺纳米纤维
NGAL 中性粒细胞明胶蛋白酶相关脂质运载蛋白
中性粒细胞明胶酶相关脂质运载蛋白
中性粒细胞相关载脂蛋白
中性粒细胞明胶酶蛋白
PLIF (posterior lumbar interbody fusion)
经后路椎体间融合术,经后路腰椎椎间融合术,腰
椎后路椎间融合术13
电阻焊 870
点焊 4014 (点焊-电阻焊) 3786
缝焊 997 (缝焊-电阻焊) 935
凸焊 232 (凸焊-电阻焊) 186
实际报道“电阻焊”的文献量:
870+ 3786+ 935+ 186= 5777(篇)
14
使用不同位类的概念词
废弃物回收
利用
掩埋
填埋
焚烧
废品
分析过程
or检索词:处理
检索词:回收
检索词:利用
检索词:垃圾
检索词:废弃物
and
or
分析结果
检索表达式:
主题=(垃圾 or 废弃物)and (处理 or 回收 or 利用)
v 排除比较泛指、检索意义不大的概念,如 “发展”、
“趋势”、“现状”、“关系”等概念
v 少用外延十分宽广的概念,诸如“工艺”、“分
析”、“应用”、“研究”,及“有机物”、“无
机物”、“重金属”、“轻金属”、“高分子材料”
等,一般都应转换成具体的方法或材料、化合物。
v 不确定,不了解的学科要找参考资料,充分了解文献主题所属
的学科范畴和内涵;
v 提炼出的文献主题的专指度和网罗度应该与文献实际相符。
18
抽取检索词
Ë 查找有关吸烟与肺癌的关系的文献
检索词 : 吸烟
检索词 : 肺癌and
全自动家装喷涂机器人喷涂同面积
大小墙体的效率为人员喷涂的5-10倍,
大大提升喷涂效率,均匀将涂料喷至墙
体,减少人员喷涂原料的浪费,操作简
单容易,大大减轻人员的工作量。
取词:喷涂 机器人
结果:
看到相关词: 改进:
喷漆 喷粉 涂装 家装 家庭装修 室内
自动化 全自动
Ë广义的检索策略是指为实现检索目标而制定的全盘计划和方案,包括分析课题、选择检索系统、数据库、检索入口,确定检索词及其相互间的逻辑关系等一系列的科学措施。
Ë狭义的检索策略是指检索式,是用来表达用户检索提问的逻辑表达式,是检索策略的综合体现。
22
数据库类型:
Ë期刊库、学位论文库、会议论文库、专利标准库
Ë根据自己的需求和数据库的学科范围去选择恰当的检索系统。
23
主要指:
Ë分类检索、
Ë主题检索、
Ë作者检索、
Ë篇名检索等
24
Ë确定检索词 :见检索词的选择
Ë构造检索式:主要使用布尔逻辑算符、位置算
符、截词算符、限制算符,将检索词进行组配,
确定检索词之间的概念关系或位置关系,准确
地表达课题需求的内容,以保证和提高检索的
查全率和查准率。
25
Ë 1、如果检索结果太多,可缩小检索范围,提高查准率。①使用逻辑非剔除无关内容; ②使用规范词、下位类主题词,提高检索词专指度; ③限定检索字段; ④限定文献外表特征,如语种、时间等; ⑤将AND算符改为更严格的位置算符。
Ë 2、如果检索结果太少或为0,可扩大检索范围,提高查全率。①少用AND,多用OR; ②使用主题词的同义词、近义词、上位类词; ③使用截词符,以检出所有词干相同的词; ④将限制严格的位置算符改为不太严格的位置算符; ⑤选择更合适的数据库。
26
维普资讯
Ë 中文科技期刊数据库
《中文科技期刊数据库》收录期刊总数14000余种,其中核心
期刊1983种,全文保障文献5700余万篇,收录时间从1989年至
今,部分期刊回溯至1955年。
涵盖社会科学、自然科学、工程技术、农业、医药卫生、经济、
教育和图书情报等学科,除正式出版发行的期刊外还包含一些
内部 刊物。
万方数字资源系统
Ë 万方数字化期刊
数字化期刊是万方数字资源系统的重要内容,基本包括了我
国文献计量单位中自然科学类统计源刊和社会科学类核心源期
刊的全文资源,收录期约8000余种,核心期刊3200种左右。
三大中文期刊全文库之特点比较
Ë 收录期刊量
CNKI中国期刊全文库:8387种
万方数字化期刊:8000种
维普科技期刊全文库:14000种
Ë 期刊来源情况
CNKI中国期刊全文库:大多为正式出版期刊,少量内刊和非正式出版期
刊
万方数字化期刊:全部为正式出版期刊
维普科技期刊全文库:包含相当一部分内部刊物和非正式出版刊物
Ë 中国知网总库平台:对检索结果的分析功能比
较强大,如果需要对检索结果进行整理和分析,
建议选择中国知网。
Ë 万方数字资源系统:刊物均为正式刊物且刊物
信息比较全面和准确,更适合投稿信息的查找;
另外中华医学会的100 多种期刊2006 年后的全
文只在万方里收录,所以更适合医学专业读者
使用;检索界面简单,检索功效率较高。
Ë 维普的中文科技期刊数据库:收录期刊量最大,
全面了解研究现状时必选。
文献检索•基本检索•传统检索•高级检索•检索历史•期刊导航
期刊文献检索
全文保障•在线阅读•全文下载•文献传递•开放连接
Ë 期刊文献检索:满足用户检索及文献保障的需求
多种灵活的检索方式
期刊文献检索
基本检索•简单快捷的中文期刊文献检索方式 ,可以增加多个检索框输入检索条件做由上至下的组配检索;
增加或减少检索框
相当于逻辑词“与”
相当于逻辑词“或”
相当于逻辑词“非”
二次检索
题录信息呈现
通过学科聚类的一些论文
文献细览页突出在线阅读及全文下载服务链接
高级检索
同义词
同义词
同名作者
同名作者
同义词功能只适用于三个检索字段:
关键词、题名与题名或关键词
同名作者功能只适用于两个检索字段:
作者、第一作者
注 意
•同义词——保障查全率,防止漏检。•同名作者——排除其他同名作者,提高查准率。
万方数据资源系统
检索首页
铁路 智能运输系统
一框式检索
可直接输入检索表达式
收录该主题相关文章较多的期刊即为适合投稿的期刊
导出文献
在万方数据首页中点击各类资源进入相关导航页
期刊浏览
The end,thank you!