22
16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

  • Upload
    zorana

  • View
    73

  • Download
    0

Embed Size (px)

DESCRIPTION

16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq. 何 飞. 基本问题. 问题 1 : 针对一个或者多个细古菌菌落,鉴定其成员和定量其成员的丰度 问题 2 : 针对多个细古菌菌落, 检验是否有差别和分析其差别. 实验方法. 方法 1 : 细古菌落鸟抢法测序, 数据来源小部分已知或者大部分未知的细古菌全基因组片断,分析复杂和困难 方法 2 : 16S rDNA 测序, 数据来自大部分已知细古菌的 16S rDNA 片断, 分析简易. - PowerPoint PPT Presentation

Citation preview

Page 1: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

何 飞

Page 2: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

基本问题

① 问题 1 : 针对一个或者多个细古菌菌落,鉴定其成员和定量其成员的丰度

② 问题 2 : 针对多个细古菌菌落, 检验是否有差别和分析其差别

Page 3: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

实验方法① 方法 1 : 细古菌落鸟抢法测序, 数据来源

小部分已知或者大部分未知的细古菌全基因组片断,分析复杂和困难

② 方法 2 : 16S rDNA 测序, 数据来自大部分已知细古菌的 16S rDNA 片断, 分析简易

Page 4: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

16S rRNA

① 16s rRNA 基因是进化遗传研究的重要对象, 相对于细菌的表型鉴定, 16s rRNA 基因检测技术已成为细菌检测和鉴定的使用广泛和快速的工具

② 16S rRNA 基因是存在于原核生物基因组上编码rRNA 相对应的 DNA 序列。

③ 16S rRNA 基因长度是 1.5kb , 具有高度保守性区域和高度特异性区域,特异性区域成为物种特异的标志序列。

Page 5: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

实验步骤① 细古菌基因组 DNA 提取②16S rRNA 特定区域扩增引物设计③PCR 扩增④PCR 产物纯化⑤Roche454 测序

Page 6: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

数据产生① Roche454 测序仪产生 .sff 数据文件② 从 .sff 数据文件提取 .fna 数据文件和 .qual 数据文件③ .fna 数据文件保存碱基序列

>HKSD5CR01D6P3I length=70 xy=1599_2828 region=1 run=R_2012_03_15_01_23_26_GGAGTAGCATGCGTGACGAATCGTAGTTCCGACCATAACGATGCCGACCTTTGACCACGA

④ .qual 数据文件保存质量分数序列 >HKSD5CR01D6P3I length=70 xy=1599_2828 region=1 run=R_2012_03_15_01_23_26_40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 39 39 39 40 40 40 34 34 34 34 40 30 30 30 40 39 39 39 38 38 37 40 40 38 38 32 24 17 17 20 20 26 30 30 36 36 37 40 40 4040 40 40 40 40 40 40 39 39 39

⑤ 测序长度分布统计

Page 7: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

长度分布统计

Page 8: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

收录 16S rRNA 序列的常用数据库①NCBI Nucleotide database ( NT 库)

网址: ftp://ftp.ncbi.nih.gov/blast/db/②GreenGenes database

网址: http://greengenes.lbl.gov/cgi-bin/nph-index.cgi

③Ribosomal database project database 网址: http://rdp.cme.msu.edu/

④Silva: comprehansive ribosomal RNA database 网址: http://www.arb-silva.de/

Page 9: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

16S rRNA 数据分析常用软件①Mothur

网址: http://www.mothur.org/②QIIME ( Quantitative Insights Into Microbial Ecolog

y ) 网址:http://qiime.sourceforge.net/tutorials/tutorial.html

③ GreenGenes database 网址: http://greengenes.lbl.gov/cgi-bin/nph-index.cgi

④ Ribosomal database project database 网址: http://rdp.cme.msu.edu/

Page 10: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

数据分析内容

① 序列预处理

② 序列聚类操作分类单元( OTU )

③Alpha 多样性分析

④ 赋予物种分类单元

⑤Beta 多样性分析

⑥ 组间物种分类单元筛选

Page 11: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

序列预处理① 识别和去除序列起始 8 个碱基样本标记 Barcode

( perl script )② 去出引物序列 下载地

址: http://compbio.dfci.harvard.edu/tgi/software/ 执行命令: ./seqclean *.fna -v primer.fa 和 ./cln2qual *.fna.cln *.qual

③ 去除序列中的低质量区域 下载地址: http://lucy.sourceforge.net/ 执行命令: /lucy *.fna.clean *.qual.clean -e 0.03 0.03 -w 30 0.03 10 0.1 –b 4 0.03

Page 12: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

序列聚类操作分类单元( OTU )① 操作分类单元( OTU ) : 多条序列相似性为

0.97 被认为可能属于同一个属( genus ), 相似性为 0.99 被认为可能属于同一个种( species ) 软件下载地址: http://www.drive5.com/uclust/downloads1_1_579.html 执行命令: ./uclust --sort *.fa --output *.sort.fa 执行命令: ./uclust -input *.sort.fa -uc *.uc

Page 13: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

Alpha 多样性分析①Alpha 多样性指标:丰富度( richness )、香

农指数( Shannon index )② 稀疏分析图:以样本中随机抽取序列数为横

坐标 , 相应的 Alpha 多样性指数为纵坐标所得,每条曲线是一个样本

③ 软件下载地址: http://www.mothur.org/wiki/Download_mothur 执行命令: ./mothur “collect.single(list=*.txt, freq=10);”

Page 14: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

丰富度指数稀疏分析图

Page 15: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

香农指数稀疏分析图

Page 16: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

赋予物种分类单元① 物种分类单元分为 6 层, 它们依次为

domain 、 phylum 、 class 、 order 、 family 、 genus

② 软件下载地址: http://sourceforge.net/projects/rdp-classifier/

③ 执行命令: java –jar rdp_classifier-2.4.jar -q *.fa -o *.output

④ 画物种分类单元丰度比例图, genus 的域值设置为 0.8

Page 17: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

物种分类单元丰度比例图

Page 18: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

Beta 多样性分析① 取 uclust 聚类生成的代表性序列进行多序列比对, 多序列比

对需要参考核心 16S rDNA 多序列队列文件:core_set_aligned.fasta.imputed 下载地址: http://pynast.sourceforge.net/ 多序列队列文件:http://greengenes.lbl.gov/Download/Sequence_Data/Fasta_data_files/ 执行命令: ./pynast -p 0 -l 0 -i *.fa -t core_set_aligned.fasta.imputed

② 构建代表性序列为节点的进化树 下载地址: http://microbesonline.org/fasttree/ 执行命令 ./FastTree –gtr -nt *.tree

③ Beta 多样性分析: 样本距离计算 , 需要序列丰度信息 网站访问地址: http://bmf2.colorado.edu/fastunifrac/

Page 19: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

样本距离矩阵

Page 20: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

样本聚类和 PCA

Page 21: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

组间物种分类单元筛选① 物种分类单元特征包括 5 层, 分别是

phylum 、 class 、 order 、 family 、 genus 。根据 RDP 分类器的样本和物种分类单元丰度矩阵结果, 利用统计检验筛选组间的差异物种分类单元特征 , 如果每个样本组只有一个样本, 采用Fisher 精确检验, 如果每个样本组大于等于两 个样本, 采用 T 检验。 软件下载地址 http://metastats.cbcb.umd.edu/

Page 22: 16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq

谢 谢!