25
基基基基基基基基基基基基基基基基 GWAS 基基基基基基基基 基基基 基基基 [email protected] 2011.8.12

基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

  • Upload
    dyani

  • View
    283

  • Download
    11

Embed Size (px)

DESCRIPTION

基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用. 潘玉春 王起山 [email protected] 2011.8.12. 一、背景. GWAS 全基因组关联分析方法( GWAS )是近几年提出的复杂性状功能基因鉴定的新策略。该方法是基于全基因组范围内的序列变异,筛选出那些与性状关联的 SNPs 。 问题 — 需要对数以万计的 SNP 位点进行检测,可能出现许多假阳性或假阴性的结果。 — 缺乏对显著 SNP 的生物学解释(如所处的代谢通路、生物过程等),导致很难解释性状的分子遗传机制。. GSEA-GWAS - PowerPoint PPT Presentation

Citation preview

Page 1: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

基于基因集富集分析的畜禽复杂性状GWAS分析平台及其应用

潘玉春 王起山[email protected]

2011.8.12

Page 2: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

2

一、背景

Page 3: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

3

GWAS

全基因组关联分析方法( GWAS )是近几年提出的复杂性状功能基因鉴定的新策略。该方法是基于全基因组范围内的序列变异,筛选出那些与性状关联的 SNPs 。

问题— 需要对数以万计的 SNP 位点进行检测,可能出现许多假阳

性或假阴性的结果。— 缺乏对显著 SNP 的生物学解释(如所处的代谢通路、生物

过程等),导致很难解释性状的分子遗传机制。

Page 4: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

4

GSEA-GWAS 基因集富集分析的基本思想是使用预定义的基因集(通常来自功能注释或先前实验的结果),筛选出与性状显著相关的通路等注释集合。

引入基因集富集分析的方法比单基因分析能获得更多、更有生物学意义的基因信息,将有助于解决上述两个问题。

Mootha 等( 2003)提出用于表达芯片的数据分析

Wang Kai 等( 2007)扩展到 GSEA-GWAS

Page 5: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

5

GWAS using single marker based association

test

Page 6: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

6

GWAS 分析结果

选择 GWAS 结果显著的SNP 集合进行 Fisher 检验

显著的基因集基因集 QTL 映射 功能验证

GSEA-GWAS 分析流程

基因映射 SNP

基因集映射基因基因集定义

选择 GWAS 结果中所有SNP 进行富集分析

Page 7: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

7

目前基于基因集富集分析的全基因组关联分析方法( GSEA-GWAS)已经应用于人类(随机无关人群或核心家系)和小鼠(高度近交)的资源群体。

http://www.nr.no/pages/gseasnp

(Bioinformatics 2008)

https://webtools.imbs.uni-luebeck.de/snptogo

(Bioinformatics 2008)

GSEA-GWAS 研究进展

Page 8: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

8

二、畜禽 GSEA-GWAS平台

牛基因组 SNP功能注释与 Fisher富集分析平台

http://klab.sjtu.edu.cn/SNPknow

http://klab.sjtu.edu.cn/SNPpath

猪、牛、鸡基因集富集分析平台

http://klab.sjtu.edu.cn/GWAS

Page 9: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

9

– KEGG Pathway:

转录调控、信号转导、代谢

– Gene Ontology:

cellular component, biological process, molecular function 支持基因集

牛 SNP 功能注释及 Fisher 富集分析平台

Page 10: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

10

Homepage of SNPpath

Cluster for Computering

SNPpath Web Server

Path details Result Page

Gene Ontology associated with traits

MySQL DatabaseGene Ontology

分析流程

Page 11: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

11

Fisher’s精确概率法利用超几何分布的原理推断每个基因集中的差异表达基因的比例是否与整个基因芯片上差异表达基因的比例相同。

差异表达SNP

非差异表达SNP

合计基因集注释的 SNP a b a+b非基因集注释的

SNPc d c+d

合计 a+c b+d a+b+c+d

分析原理

Page 12: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

1212

分析实例Snelling et al. 2010 Journal of Animal Science

2013 animals

BovineSNP50 BeadChip (50K) assay

birth weight (BWT), BW gain from birth to weaning, adjusted to 205 days (WG), 205-day adjusted weaning weight (WW), 160-day adjusted postweaning BW gain (PWG)365-day adjusted yearling weight (YW).

Page 13: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

13

Growth traits Pathway ID Pathway name P value

birth weight( BWT)00330 Arginine and proline metabolism 0.0405

00480 Glutathione metabolism 0.0213

205-day preweaning gain (WG)00030 Pentose phosphate pathway 0.0184

00512 O-Glycan biosynthesis 0.0637

160-day postweaning gain (PWG)

04620 Toll-like receptor signaling pathway 0.0762

00330 Arginine and proline metabolism 0.0405

00480 Glutathione metabolism 0.0213

205-day weaning weight (WW)00330 Arginine and proline metabolism 0.0405

00480 Glutathione metabolism 0.0213

365-day yearling weight (YW)

00030 Pentose phosphate pathway 0.0184

00330 Arginine and proline metabolism 0.0405

00480 Glutathione metabolism 0.0213

Page 14: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

14

Page 15: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

15

发表论文

Page 16: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

16

– KEGG Pathway:

转录调控、信号转导、代谢– Gene Ontology:

cellular component, biological process, molecular function

– the Pfam protein families database (Pfam)

– protein domains, families and functional sites (PROSITE)

猪、牛、鸡基因集富集分析平台

支持基因集

Page 17: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

17

Single column P-values, the data can be analyzed using Irizarry‘s method ;

Two columns of P-values, the data can be analyzed using either the F test or t test;

The program also accepts up to 5000 columns of P-values which can be analyzed using either the Efron‘s re-standardized .

支持物种猪、 牛、 鸡

分析方法

Page 18: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

18

程序主页

Page 19: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

19

注释集合

Page 20: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

20

富集分析流程

Page 21: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

21

Snelling et al. 2010. J. Anim. Sci. 88(3):837–848.

To illustrate the application of GWASknow, we analyzed the SNP data from the GWAS of growth in crossbred beef cattle which used BovineSNP50 BeadChip (50K) assay. Body weights (BW) gain from birth to weaning were utilized.

分析实例

Page 22: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

22

The analysis results by the restandardized method are shown. A total of 28 KEGG pathway gene sets having FDR-corrected p-values< 0.01 were tabulated.

Page 23: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

23

http://animalgenome.org/cgi-bin/QTLdb/BT/summary

Many of the gene sets we identified made good biological senses. For example, The KEGG terms 'Selenoamino acid metabolism' and 'O-Glycan biosynthesis' overlap QTL described for average daily gain, body weight, feed conversion ratio.

QTL 映射

Page 24: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

24

相关论文

Page 25: 基于基因集富集分析的畜禽复杂性状 GWAS 分析平台及其应用

25

Thanks!

农业与生物学院动物科学系上海市兽医生物技术重点实验室