13
木木木木木木木木木木木木木木木木 木木木 2013.6.18

木本模式植物杨树的表达数据的分析

Embed Size (px)

DESCRIPTION

木本模式植物杨树的表达数据的分析. 昝艳君 2013.6.18. 一般步骤. 探针的获取. 表达数据的获取. 1 、从 Efp 表达数据获得 2 、从 popgenie 获得 3 、从 NCBI GEO 获得. 从 Efp 表达数据获得. 1 、 Poplar eFP Browser 中有两组杨树的表达数据一组属于 tissue ;另一种属于 Drought treatment 。 2 、输入基因所对应的的探针后点击 table expression 即可得到数据. 从 Popgenie 表达 数据获得. 1 、 Pop genie 包含三类数据: - PowerPoint PPT Presentation

Citation preview

Page 1: 木本模式植物杨树的表达数据的分析

木本模式植物杨树的表达数据的分析

昝艳君 2013.6.18

Page 2: 木本模式植物杨树的表达数据的分析

LOGO

2

•基因探针的获取

•表达数据的获取

•Mev的使用以及热图绘制技巧

一般步骤

Page 3: 木本模式植物杨树的表达数据的分析

LOGO

3

探针的获取

Page 4: 木本模式植物杨树的表达数据的分析

LOGO

4

表达数据的获取

1 、从 Efp 表达数据获得

2 、从 popgenie 获得

3 、从 NCBI GEO 获得

Page 5: 木本模式植物杨树的表达数据的分析

LOGO

5

从 Efp 表达数据获得

1 、 Poplar eFP Browser 中有两组杨树的表达数据一组属于 tissue ;另一种属于Drought treatment 。

2 、输入基因所对应的的探针后点击 table expression 即可得到数据

Page 6: 木本模式植物杨树的表达数据的分析

LOGO

6

从 Popgenie 表达数据获得

1 、 Pop genie 包含三类数据: a. Tissue comparison

b. Leaf development

c. wood series

2. 每类有不同的实验系列,通过输入V2.2popname 获得,如果所找的基因名称为 POPV1.1 或者 V3.0 则需要在AspenDB 中做转换,如果转换不了则需要做 Blast 对应

Page 7: 木本模式植物杨树的表达数据的分析

LOGO

7

从 Efp 表达数据获得

1 、 Poplar eFP Browser 中有两组杨树的表达数据一组属于 tissue ;另一种属于Drought treatment 。

2 、数据检索只适合于 Affymetrix探针。 对于一个基因有多个探针的要取中位数不

是平均值

Page 8: 木本模式植物杨树的表达数据的分析

LOGO

8

从 NCBI GEO 获得

1 、 GEO 中检索目标物种拿到 GSM 分类号选择感兴趣的进入获得 GSE 号,点击下载到 text 格式的 Rawdata

2 、找到内参的探针一般为 GAPDH Actin 或者 Toblin

3 、 Rawdata 中对应表达量为绝对表达量,要经过内参归一化,即每个所得到的绝对表达除以对应 GSM 号的内参表达,然后重复之间取平均值

Page 9: 木本模式植物杨树的表达数据的分析

LOGO

9

数据分析

1 、绝对表达数据的相对化 将同一基因的所有 tissue 的绝对表

达量取平均值,然后用平均值除各自tissue 的所得值得 log2 去做热图

2 、如果不取对数,不同基因间表达差异造成每个 tissue 的变异系数太大,无法统一色域范围

Page 10: 木本模式植物杨树的表达数据的分析

LOGO

10

热图绘制

Multiple Array Viewer 里 File 下选择 load data, 弹出ExpressionFileLoader 窗口,其中利用 Browse 选择数据文件,在two-color Array 和 single-color Array 中选择所想要的格式(双色heat map 还是单色,一般说来如果元数据是线性表达,即没有经过 LN 转换,则可以选择单色 heat map ,否则就选双色 heat map ) . 选择的元数据文件应该是 .txt 格式,虽然最开始可以用Excel 编辑,但最后存为 .txt (制表符分割)格式。如果元数据文件格式正确,应在最下方 Expression Table 里看到文件预览,选择左上方第一个表达数据 cell ,单击 load ,在 multiple array viewer 中会自动生成 heat map 。

Page 11: 木本模式植物杨树的表达数据的分析

LOGO

11

热图的分析

heat map 输出文件的调整。1 )每个 element 的大小:选择 Display , set element size, custom,

输入款和高的数值,直到大小和比例合适为止。相应的文字会随着每个 element 大小的变化而相应变化,如果文字不合适最后存成图片后可以只裁减图的部分,边上另外加文字说明组织和基因号。

2 )分组( clustering, 即相似的组织或相似的基因聚类)选择analysis , clustering ,HCL, 之后可以选择只对基因或 sample 进行聚类,还是双向都聚类分析。最后选 OK 。这时还看不到任何变化,看聚类后的结果需要双击 Multiple Array Viewer 左边AnalysisResults 下的 HCL ( 1 ), HCL tree ,则可看到聚类后的结果。

Page 12: 木本模式植物杨树的表达数据的分析

LOGO

12

最终结果

Page 13: 木本模式植物杨树的表达数据的分析

Thank you

谢 谢