Upload
clare-best
View
51
Download
1
Embed Size (px)
DESCRIPTION
木本模式植物杨树的表达数据的分析. 昝艳君 2013.6.18. 一般步骤. 探针的获取. 表达数据的获取. 1 、从 Efp 表达数据获得 2 、从 popgenie 获得 3 、从 NCBI GEO 获得. 从 Efp 表达数据获得. 1 、 Poplar eFP Browser 中有两组杨树的表达数据一组属于 tissue ;另一种属于 Drought treatment 。 2 、输入基因所对应的的探针后点击 table expression 即可得到数据. 从 Popgenie 表达 数据获得. 1 、 Pop genie 包含三类数据: - PowerPoint PPT Presentation
Citation preview
木本模式植物杨树的表达数据的分析
昝艳君 2013.6.18
LOGO
2
•基因探针的获取
•表达数据的获取
•Mev的使用以及热图绘制技巧
一般步骤
LOGO
3
探针的获取
LOGO
4
表达数据的获取
1 、从 Efp 表达数据获得
2 、从 popgenie 获得
3 、从 NCBI GEO 获得
LOGO
5
从 Efp 表达数据获得
1 、 Poplar eFP Browser 中有两组杨树的表达数据一组属于 tissue ;另一种属于Drought treatment 。
2 、输入基因所对应的的探针后点击 table expression 即可得到数据
LOGO
6
从 Popgenie 表达数据获得
1 、 Pop genie 包含三类数据: a. Tissue comparison
b. Leaf development
c. wood series
2. 每类有不同的实验系列,通过输入V2.2popname 获得,如果所找的基因名称为 POPV1.1 或者 V3.0 则需要在AspenDB 中做转换,如果转换不了则需要做 Blast 对应
LOGO
7
从 Efp 表达数据获得
1 、 Poplar eFP Browser 中有两组杨树的表达数据一组属于 tissue ;另一种属于Drought treatment 。
2 、数据检索只适合于 Affymetrix探针。 对于一个基因有多个探针的要取中位数不
是平均值
LOGO
8
从 NCBI GEO 获得
1 、 GEO 中检索目标物种拿到 GSM 分类号选择感兴趣的进入获得 GSE 号,点击下载到 text 格式的 Rawdata
2 、找到内参的探针一般为 GAPDH Actin 或者 Toblin
3 、 Rawdata 中对应表达量为绝对表达量,要经过内参归一化,即每个所得到的绝对表达除以对应 GSM 号的内参表达,然后重复之间取平均值
LOGO
9
数据分析
1 、绝对表达数据的相对化 将同一基因的所有 tissue 的绝对表
达量取平均值,然后用平均值除各自tissue 的所得值得 log2 去做热图
2 、如果不取对数,不同基因间表达差异造成每个 tissue 的变异系数太大,无法统一色域范围
LOGO
10
热图绘制
Multiple Array Viewer 里 File 下选择 load data, 弹出ExpressionFileLoader 窗口,其中利用 Browse 选择数据文件,在two-color Array 和 single-color Array 中选择所想要的格式(双色heat map 还是单色,一般说来如果元数据是线性表达,即没有经过 LN 转换,则可以选择单色 heat map ,否则就选双色 heat map ) . 选择的元数据文件应该是 .txt 格式,虽然最开始可以用Excel 编辑,但最后存为 .txt (制表符分割)格式。如果元数据文件格式正确,应在最下方 Expression Table 里看到文件预览,选择左上方第一个表达数据 cell ,单击 load ,在 multiple array viewer 中会自动生成 heat map 。
LOGO
11
热图的分析
heat map 输出文件的调整。1 )每个 element 的大小:选择 Display , set element size, custom,
输入款和高的数值,直到大小和比例合适为止。相应的文字会随着每个 element 大小的变化而相应变化,如果文字不合适最后存成图片后可以只裁减图的部分,边上另外加文字说明组织和基因号。
2 )分组( clustering, 即相似的组织或相似的基因聚类)选择analysis , clustering ,HCL, 之后可以选择只对基因或 sample 进行聚类,还是双向都聚类分析。最后选 OK 。这时还看不到任何变化,看聚类后的结果需要双击 Multiple Array Viewer 左边AnalysisResults 下的 HCL ( 1 ), HCL tree ,则可看到聚类后的结果。
LOGO
12
最终结果
Thank you
谢 谢