118
GenBank GenBank 数数数数数数数数数 数数数数数数数数数 —— —— Entrez Entrez 数数数数 数数数数 数数数数数数数

GenBank 数据库检索及其应用 ——Entrez 检索功能

  • Upload
    robert

  • View
    394

  • Download
    0

Embed Size (px)

DESCRIPTION

GenBank 数据库检索及其应用 ——Entrez 检索功能. 重庆医科大学图书馆 李 轶. 简介. GenBank 数据库是由美国国立生物技术信息中心( NCBI )维护的一级核酸序列数据库。. GenBank 数据库的数据来源有三种: 1 、直接来源于测序工作者提交的序列; 2 、与其它数据机构协作交换的数据; 3 、美国专利局提供的专利数据。. NCBI 网站网址: http://www.ncbi.nlm.nih.gov. GenBank 和 PubMed( 序列数据 ) 检索的比较 :. 1 、 GenBank 的检索结果是序列及其注释信息; - PowerPoint PPT Presentation

Citation preview

Page 1: GenBank 数据库检索及其应用 ——Entrez 检索功能

GenBankGenBank 数据库检索及其应用数据库检索及其应用———— EntrezEntrez 检索功能检索功能

重庆医科大学图书馆李 轶

Page 2: GenBank 数据库检索及其应用 ——Entrez 检索功能

简介 GenBank 数据库是由美国国立生物技术信息中心( NCBI )维护的一级核酸序列数据库。

GenBank 数据库的数据来源有三种:

1 、直接来源于测序工作者提交的序列;

2 、与其它数据机构协作交换的数据;

3 、美国专利局提供的专利数据。

Page 3: GenBank 数据库检索及其应用 ——Entrez 检索功能

NCBI 网站网址:

http://www.ncbi.nlm.nih.gov

Page 4: GenBank 数据库检索及其应用 ——Entrez 检索功能

GenBankGenBank 和和 PubMed(PubMed( 序列数据序列数据 )) 检索的比较检索的比较::1 、 GenBank 的检索结果是序列及其注释信息; PubMed 的检索结果是与序列数据相关的文献信息。

2 、 GenBank 数据更新早于 PubMed , GenBank 数据库的检全率高于 PubMed 。

3 、 GenBank 可对序列数据进行限制检索,而 PubMed 只能对文献、杂志、作者等进行限制检索,因而 GenBank 数据库的检准率也高于 PubMed 。

Page 5: GenBank 数据库检索及其应用 ——Entrez 检索功能

检索界面

简介

Page 6: GenBank 数据库检索及其应用 ——Entrez 检索功能

基本检索输入框

基本检索界面:

Page 7: GenBank 数据库检索及其应用 ——Entrez 检索功能

执行检索按钮

基本检索输入框

基本检索界面:

ras[GENE]

Page 8: GenBank 数据库检索及其应用 ——Entrez 检索功能

点击进入跨库检索

Page 9: GenBank 数据库检索及其应用 ——Entrez 检索功能

跨库检索界面:

ras[GENE]

执行检索按钮

Page 10: GenBank 数据库检索及其应用 ——Entrez 检索功能

跨库检索界面:

Page 11: GenBank 数据库检索及其应用 ——Entrez 检索功能

点击进入 GenBank 数据库

Page 12: GenBank 数据库检索及其应用 ——Entrez 检索功能

GenBank 数据库界面:

Page 13: GenBank 数据库检索及其应用 ——Entrez 检索功能

GenBank 数据库界面:

Page 14: GenBank 数据库检索及其应用 ——Entrez 检索功能

点击进入核苷酸序列数据库检索界面

GenBank 数据库界面:

Page 15: GenBank 数据库检索及其应用 ——Entrez 检索功能

特征栏提供辅助检索功能

核苷酸序列数据库检索界面:

Page 16: GenBank 数据库检索及其应用 ——Entrez 检索功能

核苷酸序列数据库检索界面:

Page 17: GenBank 数据库检索及其应用 ——Entrez 检索功能

简介

检索界面

基本检索功能(一)名称、作者姓名、截词检索、布尔逻辑运算

(二)特殊标志符检索

(五)范围检索

(三)序列长度检索(四)分子重量检索

Page 18: GenBank 数据库检索及其应用 ——Entrez 检索功能

简介

检索界面

基本检索功能(一)名称、作者姓名、截词检索、布尔逻辑运算

Page 19: GenBank 数据库检索及其应用 ——Entrez 检索功能

检索限定词:

1 、基因名称的检索限定词: [GENE]

2 、生物体名称的检索限定词: [ORGN]

3 、作者姓名的检索限定词: [AUTH]

Page 20: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 21: GenBank 数据库检索及其应用 ——Entrez 检索功能

简介

检索界面

基本检索功能(一)名称、作者姓名、截词检索、布尔逻辑运算(二)特殊标志符检索

Page 22: GenBank 数据库检索及其应用 ——Entrez 检索功能

特殊标志符的格式(核酸序列) :

2 、 GenBank/EMBL/DDBJ 序列接受号: (1)1 个字母 +5 个阿拉伯数字 e.g. : U12345 (2)2 个字母 +6 个阿拉伯数字 e.g. : AY123456 , Af123456

1 、序列辨认号( GI ):一串阿拉伯数字 e.g. : 6995995

Page 23: GenBank 数据库检索及其应用 ——Entrez 检索功能

( 1 ) mRNA 记录( NM_* ) :

e.g.:NM_000492

( 2 )基因组 DNA 重叠群( NT_* ) :

e.g.:NT_000347

( 3 )完整的基因组或染色体( NC_* ) :

e.g.:NC_000907

( 4 )基因组的局部区域( NG_* ) :

e.g.:NG_000019

( 5 )从人类基因组序列注释、加工得到的序列模型记录( XM ,XP , or XR_* ):

e.g.:XM_000483

特殊标志符的格式(核酸序列):3 、 RefSeq ( Reference Sequence )序列接受号 :

Page 24: GenBank 数据库检索及其应用 ——Entrez 检索功能

特殊标志符的格式(核酸序列):

4 、 PDB 序列接受号:1个阿拉伯数字+3个字母

e.g. :1 TUP序列接受号的检索限定词为 [ ACCN]or[ACCESSION]

Page 25: GenBank 数据库检索及其应用 ——Entrez 检索功能

AF123456[ACCN]

Page 26: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 27: GenBank 数据库检索及其应用 ——Entrez 检索功能

简介

检索界面

基本检索功能

(一)名称、作者姓名、截词检索、布尔逻辑运算(二)特殊标志符检索(三)序列长度检索

Page 28: GenBank 数据库检索及其应用 ——Entrez 检索功能

1510[SLEN]

序列长度的检索限定词: [SLEN]

Page 29: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 30: GenBank 数据库检索及其应用 ——Entrez 检索功能

简介

检索界面

基本检索功能

(一)名称、作者姓名、截词检索、布尔逻辑运算(二)特殊标志符检索(三)序列长度检索(四)分子重量检索

Page 31: GenBank 数据库检索及其应用 ——Entrez 检索功能

2009[MOLWT]

分子重量的检索限定词: [MOLWT]

Page 32: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 33: GenBank 数据库检索及其应用 ——Entrez 检索功能

简介

检索界面

基本检索功能

(一)名称、作者姓名、截词检索、布尔逻辑运算(二)特殊标志符检索

(五)范围检索

(三)序列长度检索(四)分子重量检索

Page 34: GenBank 数据库检索及其应用 ——Entrez 检索功能

范围检索:范围检索:中间用冒号连接中间用冒号连接 1 、序列接受号范围检索: AF114696:AF114714[ACCN] 2 、序列长度范围检索: 3000 : 4000[SLEN] 3 、分子重量范围检索: 2002 : 2009[MOLWT] 4 、日期范围检索: 2005/01 : 2006/09/26[MDAT]or[PDAT]

Page 35: GenBank 数据库检索及其应用 ——Entrez 检索功能

简介

检索界面

基本检索功能

特征栏辅助检索限制检索( Limits )预检索 / 索引检索( Preview/Index )检索史管理( History )剪贴板管理( Clipboard )详细匹配过程( Details )

Page 36: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制检索

预检索 / 索引检索

检索史管理 剪贴板管理

详细匹配过程

Page 37: GenBank 数据库检索及其应用 ——Entrez 检索功能

简介

检索界面

基本检索功能

特征栏辅助检索限制检索( Limits )

Page 38: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制检索界面:

Page 39: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制检索界面:

Page 40: GenBank 数据库检索及其应用 ——Entrez 检索功能

核苷酸序列数据库分为三个子数据库:核苷酸序列数据库分为三个子数据库: EST : 表达序列标记数

据库

GSS : 基因组测序序列数据库

CoreNucleotide : 包含所有未被以上两个子数据库收录的核苷酸序列

Page 41: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 42: GenBank 数据库检索及其应用 ——Entrez 检索功能

核苷酸序列数据库检索界面:

Page 43: GenBank 数据库检索及其应用 ——Entrez 检索功能

核苷酸序列数据库检索界面:

Page 44: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制检索界面:

Page 45: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制检索界面:

Page 46: GenBank 数据库检索及其应用 ——Entrez 检索功能

检索结果显示界面:

Page 47: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制检索范围

限制检索( Limits ):

Page 48: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制检索范围

ras

Page 49: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 50: GenBank 数据库检索及其应用 ——Entrez 检索功能

排除某种类型的序列

Page 51: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制分子类型

Page 52: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制分子类型

Page 53: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制基因位点

Page 54: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制基因位点

Page 55: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制序列片段的显示

Page 56: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制序列片段的显示

Page 57: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制数据来源

Page 58: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制数据来源

Page 59: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制数据修订日期

Page 60: GenBank 数据库检索及其应用 ——Entrez 检索功能

限制数据修订日期

Page 61: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 62: GenBank 数据库检索及其应用 ——Entrez 检索功能

简介

检索入口

基本检索功能

特征栏辅助检索限制检索( Limits )预检索 / 索引检索( Preview/Index )

Page 63: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 64: GenBank 数据库检索及其应用 ——Entrez 检索功能

预检索 / 索引检索界面:

hepatitis b

索引检索输入框

索引检索按钮

Page 65: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 66: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 67: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 68: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 69: GenBank 数据库检索及其应用 ——Entrez 检索功能

索引检索按钮

Page 70: GenBank 数据库检索及其应用 ——Entrez 检索功能

序列特性关键词索引

Page 71: GenBank 数据库检索及其应用 ——Entrez 检索功能

ras[GENE]

Page 72: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 73: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 74: GenBank 数据库检索及其应用 ——Entrez 检索功能

序列特性关键词索引

Page 75: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 76: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 77: GenBank 数据库检索及其应用 ——Entrez 检索功能

简介

检索界面

基本检索功能

特征栏辅助检索限制检索( Limits )预检索 / 索引检索( Preview/Index )检索史管理( History )剪贴板管理( Clipboard )详细匹配过程( Details )

Page 78: GenBank 数据库检索及其应用 ——Entrez 检索功能

penicillin-binding

Page 79: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 80: GenBank 数据库检索及其应用 ——Entrez 检索功能

mycobacterium tuberculosis

Page 81: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 82: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 83: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 84: GenBank 数据库检索及其应用 ——Entrez 检索功能

#8 AND #4

Page 85: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 86: GenBank 数据库检索及其应用 ——Entrez 检索功能

penicillin-binding AND mycobacterium tuberculosis[ORGN]

Page 87: GenBank 数据库检索及其应用 ——Entrez 检索功能

简介

检索入口

基本检索功能

特征栏辅助检索

检索结果的显示

Page 88: GenBank 数据库检索及其应用 ——Entrez 检索功能

检索结果显示界面:

Page 89: GenBank 数据库检索及其应用 ——Entrez 检索功能

选择检索结果的显示格式

Page 90: GenBank 数据库检索及其应用 ——Entrez 检索功能

选择检索结果的显示格式

Page 91: GenBank 数据库检索及其应用 ——Entrez 检索功能

选择检索结果的显示格式

Page 92: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 93: GenBank 数据库检索及其应用 ——Entrez 检索功能

摘要格式:

联接

Page 94: GenBank 数据库检索及其应用 ——Entrez 检索功能
Page 95: GenBank 数据库检索及其应用 ——Entrez 检索功能

Genbank 格式:

Page 96: GenBank 数据库检索及其应用 ——Entrez 检索功能

Genbank 格式:

Page 97: GenBank 数据库检索及其应用 ——Entrez 检索功能

Genbank 格式:

Page 98: GenBank 数据库检索及其应用 ——Entrez 检索功能

Genbank 格式:

Page 99: GenBank 数据库检索及其应用 ——Entrez 检索功能

Genbank 格式:

Page 100: GenBank 数据库检索及其应用 ——Entrez 检索功能

Genbank 格式:

Page 101: GenBank 数据库检索及其应用 ——Entrez 检索功能

Genbank 格式:

Page 102: GenBank 数据库检索及其应用 ——Entrez 检索功能

Genbank 格式:

Page 103: GenBank 数据库检索及其应用 ——Entrez 检索功能

GenBank记录中特性表中的主要关键词 :

关键词 解 释 关键词 解 释

misc_feature 生物学特性无法用特性表关键词描述的序列

promoter 转录起始区

misc_difference 序列特性无法用特性表关键词描述的序列

CAAT_signal 真核启动子上游的 CAAT盒 , 与 RNA 结合相关

conflict 同一序列在不同的研究中在位点或区域上有差异

TATA_signal 真核启动子的 TATA盒

unsure 序列不能确定的区域 -35_signal 原核启动子中的 -35框old_sequence 该序列对以前的版本做过

修订-10_signal 原核启动子的 Pribow盒

variation 包含稳定突变的序列 GC_signal 真核启动子的 GC盒modified_base 修饰过的核苷酸 RBS 核糖体结合位点gene 已识别为基因或已命名的

序列区域polyA_signal RNA转录本的剪切识别

位点misc_signal 无法用信号特性关键词描

述的信号序列enhancer 增强子

Page 104: GenBank 数据库检索及其应用 ——Entrez 检索功能

关键词 解 释 关键词 解 释attenuator 与转录终止有关的序列 CDS 蛋白质编码序列terminator 转录终止序列 sig_peptide 编码信号肽的序列rep_origin 双链 DNA复制起始区 transit_peptide 转运蛋白编码序列misc_RNA 无法用 RNA 关键词描

述的转录物或 RNA产物

mat_peptide 编码成熟肽的序列

prim_transcript 初始转录本 intron 内含子precursor_RNA 前体 RNA polyA_site RNA转录本的多聚腺苷

酸化位点mRNA 信使 RNA rRNA 核糖体 RNA

5’clip 前体转录本中被剪切掉的 5’端序列

tRNA 转运 RNA

3’ clip 前体转录本中被剪切掉的 3’端序列

scRNA 小细胞质 RNA

5’UTR 5’非翻译区 snRNA 小核 RNA

3’UTR

exon

3’非翻译区外显子

snoRNA 加工和修饰 rRNA 的小核 RNA

Page 105: GenBank 数据库检索及其应用 ——Entrez 检索功能

关键词 解 释 关键词 解 释immunoglobulin_related

repeat_unit 单个的重复元件

C_region 免疫相关蛋白上的不变区 LTR 长末端重复序列D_segment 免疫球蛋白重链的可变区,

T 细胞受体 β链Satellite 卫星重复序列

J_ segment 免疫球蛋白重链、轻链以及T 细胞 α 、 β 、 γ 的结合链

misc_binding 无法描述的核酸序列结合位点

N_ region 插入重排免疫球蛋白片段间的核苷酸

primer_bind 复制、转录的引物结合位点

S_ region 免疫球蛋白重链的开关区 protein_bind 蛋白质结合区

V_ region 编码免疫球蛋白的可变区 N末端的序列

STS 测序标签位点

V_ segment 编码免疫球蛋白的可变区的序列

misc_recomb 无法用重组特性关键词描述的重组事件

repeat_region 基因组中所包含的重复序列 iDNA 通过重组所消除的 DNA

Page 106: GenBank 数据库检索及其应用 ——Entrez 检索功能

关键词 解 释 关键词 解 释misc_structure 无法用结构关键词描述的核

酸序列高级结构或构型stem_loop 发夹结构D_loop 线粒体中 DNA 中的取代环

GenBank记录中特性表中的限定词 :

限定词 含 义 限定词 含 义/allele= 给定基因的等位基因 /codon_start= 相对于序列第一个碱基,

编码序列密码子的偏移量/bound_moiety= 嵌合范围 /country= DNA样本的来源国/cell_type= 获得序列的细胞类型 /db_xref= 其他数据库信息的交叉索

引号/citation= 已被引用的参考文献数 /direction= DNA复制方向/clone_lib= 获得序列的克隆文库 /

environmental_sample=

序列直接从环境材料中获得而没有指明来源物种

Page 107: GenBank 数据库检索及其应用 ——Entrez 检索功能

限定词 含 义 限定词 含 义/exception= 指明 DNA 序列未按通常

的生物学规律翻译,如 RNA编辑

/PCR_conditi-ons=

描述 PCR 的反应条件

/frequency= 在种群中发生变异的频率 /pop_variant= 获得序列的群体变异种名称

/germline 如果序列是 DNA并来源于免疫球蛋白家族,则表示该序列来源于未重排 DNA

/product= 序列编码产物的名称

/insertion_seq= 序列来源于某种插入元件 /anticodon= tRNA反义密码子的位置及它所编码的氨基酸

/isolate= 序列来源的生物个体 /cell_line= 获得序列的细胞系/lab_host= 为扩增序列来源物种所用

的实验室宿主/chromosome= 获得序列的染色体

/macronuclear 指明 DNA 来源于染色体分化的大核期

/clone= 获得序列的克隆子

/note= 评论及附加信息 /codon= 指出与参考密码子不同的密码子

/organelle= 获得序列的细胞器 /EC_number= 序列产物的酶学编号

Page 108: GenBank 数据库检索及其应用 ——Entrez 检索功能

限定词 含 义 限定词 含 义/cons_splice= 区分内含子剪切位点和

“ 5‘-GT.AG-3'” 剪切位点

/map= 相关特性在基因图谱上的位置

/cultivar= 所获序列植物的栽培变种 /mod_base= 被修饰碱基的简写/dev_stage= 序列来源于某种生物的特

定发育阶段/number= 从 5’→3’ 注明遗传元件的

顺序/evidence= 序列特性来源于实验还是

推理/organism= 提供测序用遗传物质的物

种的科学名称/focus 指出在记录中的来源特性

在其他物种中还有不同的来源特性

/phenotype= 序列特性所导致的表型

/function= 序列所代表的功能 /plasmid= 获得序列的质粒名称/haplotype= 序列来源于某种物种的单

倍体/protein_id= 蛋白质的检索号

/isolation_sou-rce=

描述序列来源物种的生理、环境和地理信息

/proviral 整合在基因组中的前病毒

/label= 序列特性的俗名 /rearranged 如果序列是 DNA并来源于免疫球蛋白家族,则表示该序列来源于重排 DNA

Page 109: GenBank 数据库检索及其应用 ——Entrez 检索功能

限定词 含 义 限定词 含 义/rpt_family= 重复序列 /transposon= 转座子/rpt_unit= 指明重复区域的重复元件构

成/variety= 获得序列的生物变种

/serotype= 同一物种的不同血清学特征 /pseudo 假基因/sex= 获得序列的物种性别 /replace= 表明特性间的间隔序

列已被替换/specimen_vou-cher=

指明来源物种保存于什么地方

/rpt_type= 重复序列的组织方式

/strain= 获得序列的菌珠 /sequenced_m-ol=

获得序列的分子类型

/sub_species= 获得序列的来源物种的亚种 /serovar= 同一原核生物的血清学特征

/tissue_lib= 获得序列组织库 /specific_host= 获得序列的天然宿主

/transgenic 指明物种的来源特性是否是转基因受体

/standard-name=

特性的通用名称

/transl_except= 标明序列中未按指定密码子表翻译的氨基酸的位置

/sub_clone= 获得序列的亚克隆

Page 110: GenBank 数据库检索及其应用 ——Entrez 检索功能

限定词 含 义 限定词 含 义/sub_strain= 获得序列的来源微生物亚种/tissue_type= 获得序列组织类型/translation= 按通用或指定的密码子表翻

译的氨基酸序列/transl_table= 描述在翻译中与通用密码表

不同的密码表/usedin= 表明该特性在其他检索中也

被使用/virion 病毒颗粒

Page 111: GenBank 数据库检索及其应用 ——Entrez 检索功能

FASTA 格式:

Page 112: GenBank 数据库检索及其应用 ——Entrez 检索功能

图解显示:

Page 113: GenBank 数据库检索及其应用 ——Entrez 检索功能

图解显示:

多态性碱基

Page 114: GenBank 数据库检索及其应用 ——Entrez 检索功能

序列修订记录:

Page 115: GenBank 数据库检索及其应用 ——Entrez 检索功能

序列修订记录:

Page 116: GenBank 数据库检索及其应用 ——Entrez 检索功能

序列修订记录:

Page 117: GenBank 数据库检索及其应用 ——Entrez 检索功能

序列修订记录:

Page 118: GenBank 数据库检索及其应用 ——Entrez 检索功能

谢 谢!谢 谢!