Click here to load reader
Upload
lwang19823
View
506
Download
9
Embed Size (px)
Citation preview
2016 © Cloudscientific All Rights Reserved
Best Solutions for Best research
如何利用知识库挖掘疾病相关基因
---Genevestigator+ Genecards+IPA
联合方案
王玲 产品经理 [email protected]
Tel: 131-6606-1059 QQ: 1546975078
上海康昱盛信息科技有限公司
2016 © Cloudscientific All Rights Reserved
开始实验
得到大批数据
常规数据分析--
更大批的结果
2016 © Cloudscientific All Rights Reserved
常规数据分析--更大批的结果
差异基因数量
太多—-验证谁
功能分析图表
太多—-要看谁
网络分析圈点
太多—-谁爱看
2016 © Cloudscientific All Rights Reserved
开始一项分析,必须要从问题入手:
我的差异基因有哪些特征?
我的结果与他人结果吻合吗?
我的基因对表型/功能有影响吗?
我的目标基因作用机制是什么?
2016 © Cloudscientific All Rights Reserved
开始一项分析,必须要从问题入手:
我的差异基因有哪些特征?
我的结果与他人结果吻合吗?
我的基因对表型/功能有影响吗?
我的目标基因作用机制是什么?
2016 © Cloudscientific All Rights Reserved
我的差异基因有哪些特征?
哪些基因在我的实验中
特异性表达?[常规分
析不列举]
该批基因在相关实验中
也特异性表达吗?
这些基因还在哪些组织
/细胞系/肿瘤特异性表
达
2016 © Cloudscientific All Rights Reserved
Genevestigator- samples tools该基因在相关实验中特异性表达吗?
整个库选定的条件下(比如Obesity)感兴趣的基因(TP53,MAPT)在各个样本的表达
2016 © Cloudscientific All Rights Reserved
Genevestigator- CONDITION SEARCH基因还在哪些组织/细胞系/肿瘤特异性表达
纵: 组织/细胞系/cancer
横:感兴趣的基因在不同组织/细胞系/肿瘤类型的表达情况
2016 © Cloudscientific All Rights Reserved
第一小节延伸
• 在这里我们用到了Genevestigator这个软件的功能.那么它是什么?
2016 © Cloudscientific All Rights Reserved
Genevestigator
Genevestigator是基因表达的高性能的搜索引擎。它集成了上万的人工精选、注释的公共芯片/高通量测序实验结果,使基因在不同的生物环境中,如疾病,药物,组织,肿瘤,细胞或基因型等条件下的表达进行了可视化。收录数据质量合格,对表达数据进行全局标准化,用标准化的语言对实验和样本重新进行描述。
2016 © Cloudscientific All Rights Reserved
Genevestigator功能一览
复杂的查询,简单的工具
在线分析的图形用户界面,执行分析只需点击图片代表的按钮, 操作更简单.
2016 © Cloudscientific All Rights Reserved
特点比较
单次试验分析 普通综合分析
Genevestigator
全局分析
2016 © Cloudscientific All Rights Reserved
Genevestigator全局分析的好处
为您的研究结果找到更多
支持的证据发现基因的更多特性 发现和筛选生物标志物
标准化描述对挖掘数据好处当然多多,但是全局分析有哪些优势?
更重要的是:在几分钟之内,完成对上千个实验条件的表达谱结果进行定向搜索,摆脱对电脑配置的依赖,大大节省运算时间,得到效率。
2016 © Cloudscientific All Rights Reserved
Genevestigator 目前统计
2016 © Cloudscientific All Rights Reserved
开始一项分析,必须要从问题入手:
我的差异基因有哪些特征?
我的结果与他人结果吻合吗?
我的基因对表型/功能有影响吗?
我的目标基因作用机制是什么?
2016 © Cloudscientific All Rights Reserved
我的结果与他人结果吻合吗?
Genevestigator--Signature tool:
识别哪些实验与自己表达实验结果趋势相似/不同
Genevestigator--GENE SEARCH:
识别在目标组织/细胞系/外界刺激中还有哪些特异性表
达的基因
Genevestigator—co expression:
识别在目标组织/细胞系/外界刺激中共表达基因
2016 © Cloudscientific All Rights Reserved
Genevestigator--Signature tool识别哪些实验与自己表达实验结果趋势相似/不同
可以找到在各个实验条件下,与输入的基因趋势最相似/不同的是哪些细胞系/组织/干扰条件等。
2016 © Cloudscientific All Rights Reserved
Genevestigator--GENE SEARCH:识别在特定组织/细胞系/外界刺激中还有哪些特异
性表达基因
2016 © Cloudscientific All Rights Reserved
Genevestigator—co expression:识别在目标组织/细胞系/外界刺激中表达基因
2016 © Cloudscientific All Rights Reserved
第二节延伸
• Genevestigator总共有哪些功能?
2016 © Cloudscientific All Rights Reserved
基因表达分析
2016 © Cloudscientific All Rights Reserved
基因表达调研
2016 © Cloudscientific All Rights Reserved
基因表达调研
2016 © Cloudscientific All Rights Reserved
基因表达调研
2016 © Cloudscientific All Rights Reserved
开始一项分析,必须要从问题入手:
我的差异基因有哪些特征?
我的结果与他人结果吻合吗?
我的基因对表型/功能有影响吗?
我的目标基因作用机制是什么?
2016 © Cloudscientific All Rights Reserved
我的基因与表型/功能有关吗?
GeneAnalytics
表型/功能富集分析
VarElect
快速筛选表型/功能直接/间接相关基因
IPA MAP
表型/功能活性预测分析
2016 © Cloudscientific All Rights Reserved
GeneAnalytics富集分析
对目标功能,通路,药物/代谢物等打分,对分析结果进行实时筛选和优化,并给出证据链接。
2016 © Cloudscientific All Rights Reserved
通过输入基因集合, 找到和基因最相关的疾病,通路,细胞,组织等信息。
与基因集合最相关的组织和细胞
与基因集合最相关的疾病
与基因集合最相关的通路
与基因集合最相关的功能,表型,化合物
2016 © Cloudscientific All Rights Reserved
结果展示-与基因集合最相关的疾病:可以对疾病类型,器官等进行筛选
2016 © Cloudscientific All Rights Reserved
结果展示-与基因集合最相关的疾病筛选后:与Genecards知识库关联
2016 © Cloudscientific All Rights Reserved
结果展示-与基因集合最相关的通路:不光KEGG
2016 © Cloudscientific All Rights Reserved
结果展示
2016 © Cloudscientific All Rights Reserved
GeneAnalytics富集分析与众不同之处
普通富集分析(DAVID,FunNet……)
GeneAnalytics富集分析
收集整理了二~ 几十个滞后的数据库 Geneanalytics软件利用最全面Genecards知识库,收集整理了140+多个知识库;
信息冗余仍存在,需要客户自行判断 去除了多个数据库中的冗余信息,跨越多个知识库并整合了文献信息;
对功能,通路,疾病富集打分 对相关的疾病,通路,组织和细胞特异性表达,功能,通路,药物/代谢物等打分;
无 对分析结果进行实时筛选和优化,并给出证据链接。
2016 © Cloudscientific All Rights Reserved
GenecardsSuite库
GeneCards四个数据库
•Genecards 人类基因组注释
•MalaCards人类疾病数据库
•PathCards生物学通路数据库
• LifeMap 胚胎发育干细胞分化 由以色列的Weizmann研究所基因组研究中心开发,于1997年投入使用
2016 © Cloudscientific All Rights Reserved
人类基因组注释数据库,收集了140+数据库,是一个全面的,综合人类基因有关数据的网上智能检索系统。到2016年8月份已经收录了
149991个人类基因的有关数据。
2016 © Cloudscientific All Rights Reserved
是一个全面的人类疾病数据库。它整合了68个网站的19,999 条疾病条目, 整理归纳成关于动物模型, 药物与治疗,疾病相关基因,文献,变异等信息。
2016 © Cloudscientific All Rights Reserved
针对人类的生物学pathway和其注释的集成。pathway根据基因内容的相似程度划分为Superpaths,这个的Supterpath包含了一个或多个pathway。Pathcards数据库包含了来自12个信息源的1131条SuperPath 条目。。
2016 © Cloudscientific All Rights Reserved
VarElect:利用Genecards四个数据库快速筛选表型/功能直接/间接相关基因
• 直接关联通过数据库或文献的信息来获得
与疾病/表型有直接关联的基因
2016 © Cloudscientific All Rights Reserved
VarElect:快速筛选表型/功能直接/间接相关基因
• 间接的关联通过和直接关联基因有关pathway,相互作用网络,同源基因,以及文献挖掘等途径获得。
与疾病/表型有间接关联的基因
2016 © Cloudscientific All Rights Reserved
输入基因集合&
疾病/表型submit
通过打分 找到
关键基因
基于Genecards Suite多个数据库,快速筛选表型相关基因
2016 © Cloudscientific All Rights Reserved
什么时候要用到VarElect?
要找什么基因验
证?
符合该功
能的基因
太多了!
哪个基因
和表型最
相关? 直接/间接相关基因+
证据
2016 © Cloudscientific All Rights Reserved
IPA MAP:目标表型/功能活性预测分析
42
Cardiomyocytes vs. ESC
关注趋势相反的功能/疾病:• 抑制
cardiomyopathy
• 激活contractility of cardiac muscle
激活/抑制某些基因,会引起哪些变化?
2016 © Cloudscientific All Rights Reserved
第三小节延伸
• GeneAnalytics与VarElect都是基于Genecards数据库,含超过140+数据库来源的信息
• IPA是无以伦比的基于阅读文献的库,可以预测表型/功能活性
2016 © Cloudscientific All Rights Reserved
开始一项分析,必须要从问题入手:
我的差异基因有哪些特征?
我的结果与他人结果吻合吗?
我的基因对表型/功能有影响吗?
我的目标基因作用机制是什么?
2016 © Cloudscientific All Rights Reserved
我的目标基因作用机制是什么?
IPA-up stream analysis:
差异基因受哪些上游转录因子调节?
IPA-casual network:
表型/功能受哪些上游转录因子调节?
IPA- my pathways:
目标基因所在的调控网络
2016 © Cloudscientific All Rights Reserved
IPA upstream analysis:
差异基因受哪些上游转录因子调节?
2016 © Cloudscientific All Rights Reserved
IPA casual network:
表型/功能受哪些上游转录因子调节?
Cardiac precursor vs. ESC
Myocardin 激活 SRF并驱动了心肌细胞分化
2016 © Cloudscientific All Rights Reserved
IPA- my pathways目标基因所在的调控网络
Tamiflu的靶蛋白和HDAC家族蛋白间的关系,以及如果服用Tamiflu的话,调控的生物学功能或疾病有哪些,会因为Tamiflu的摄入而如何变化
2016 © Cloudscientific All Rights Reserved
第四小节延伸
• IPA库的特点
• IPA有哪些功能
2016 © Cloudscientific All Rights Reserved
IPA
公共数据库
实验数据集
人工摘取科学文献
通路和系统建模
个人定制数据库
历经十七年的海量投入
500名PhD阅读文献;700种权威杂志全文阅读;3000种杂志摘要阅读;560万种以上的生物实验发现信息;
130万种互作信息;3万种以上分子信息;完整的功能、疾病分类数据库;800种信号通路、代谢通路
2016 © Cloudscientific All Rights Reserved
Gene, Chem, Disease,Function
分子注释实验信息来源文献
CanonicalPathways
经典信号、代谢通路数据库
UpstreamAnalysis
转录、miRNA、
小分子调控预测
CausalNetworks
非经典信号通路预测
Disease/Biological Analysis
功能、疾病注释及趋势预测
RegulatorEffects
转录调控的生物学效应
microRNAfilter
miRNA与mRNA调控分
析
Networks
蛋白、RNA相
互作用网络构建
BioProfiler
关联分子、功能、疾病、表
达趋势
Build、Overlay、Path Designer
以问题为导向构建网络
Biomarkerfilter
筛选已知疾病的临床生物标
志物
课题申请
文献查询
实验设计
靶标筛选
通路查询
网络构建
问题为导向的解决方案 数据为导向的解决方案
DNA-Seq RNA-Seq Chip-Seq
Methylation miRNA microArray
Proteomics Metabolomics Drug
IPA能帮助我们做些什么?
2016 © Cloudscientific All Rights Reserved 52
Gene View, Chem View, and
Disease/Function View
Human, Mouse Isoform Views
Canonical Pathways
Upstream Regulators/
Causal Networks
Diseases and
Biological Functions
Regulator Effects
microRNA tools
BioProfiler
Interaction Networks,
Build and Overlay tools
2016 © Cloudscientific All Rights Reserved
三个软件特点总结
Literature Driven Data Driven
Uncurated
Deeply Curated
TCGA
GEO
ArrayExpresspubmed
IPA Genecards(GeneAnalytics+VarElect模块)
Genevestigator
2016 © Cloudscientific All Rights Reserved
总结:如何利用知识库寻找疾病相关基因[红色部分:特有,绿色部分:普通]
掌握研究背景
寻找有价值的
基因
自身结果
相关实验条件
未知实验条件
与其他人的结果
比较
趋势相似/不同
其他特异性表达
/共表达基因
是否对表型/功
能产生影响
富集分析
活性预测
疾病--基因
筛选
作用机制
上游调节--基因
调控网络
上游调节--基因-
疾病/表型网络
基因互作网络
2016 © Cloudscientific All Rights Reserved
基因组学产品线一览
测序数据处理 测序/芯片数据信息挖掘 数据验证
RNA-seqDNA-seqChIP-seqSmall RNA-seqMethyl-seq
2016 © Cloudscientific All Rights Reserved
谢谢大家!