29
基基基基基基基基基基基基基基基 基基基基基基基 基基基 报报报 报报 报报报报

基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

Embed Size (px)

DESCRIPTION

基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用. 报告人:丁玮 成像中心. 提纲. 原理概述 流水线的架构设计 使用教程 部分结果展示. 原理 概述. 当前生物大分子晶体相位求解的常用方法. 同晶置换法 分子置换法 直接法. SAD. M AD. 原理概述. 结构解析中的不确定因素. 表一:使用不同的程序和各程序的默认参数求解 P202 晶体的结果。( S-SAD 方法) 表一:可以看出使用程序的默认参数,由不同的程序组合进行结构求解将会得到不同的结果。. - PowerPoint PPT Presentation

Citation preview

Page 1: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

基于参数空间筛选方法的高通量晶体结构解析流水线的应用

报告人:丁玮成像中心

Page 2: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

提纲

• 原理概述• 流水线的架构设计• 使用教程• 部分结果展示

Page 3: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

当前生物大分子晶体相位求解的常用方法

• 同晶置换法

• 分子置换法

• 直接法

3

原理概述

SAD

重原子搜索相位计算相位优化模型构建

MAD

Page 4: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

二维参数空间及程序空间筛选进行 S-SAD 相位求解的非线性特征。图中 X 轴为重原子搜索的高分辨率截取值, Y 轴为 S-SAD 相位计算的高分辨率截取值。 Z 轴是相位计算后利用 ARP/wARP 自动建模得到的Rfree 值。可以看出,只有少部分分辨率组合才能获得正确的相位。

Ru, H., Zhao, L., Ding, W., Jiao, L., Shaw, N., Liang, W., Zhang, L., Hung, L., Matsugaki, N., Wakatsuki, S. and Liu, Z. J*, (2012) The S-SAD phasing study of DR6 and its solution conformation revealed by SAXS. Acta Cryst D, in press.

结构解析中的不确定因素原理概述

表一:使用不同的程序和各程序的默认参数求解 P202 晶体的结果。( S-SAD 方法)表一:可以看出使用程序的默认参数,由不同的程序组合进行结构求解将会得到不同的结果。

SetsSteps  Set1 Set2 Set3 Set4

重原子搜索 SHELXD SHELXD Phenix.autosol

Phenix.autosol

相位计算 SHELXE SHELXE Phenix.autosol

Phenix.autosol

相位优化 DM Parrot No No

模型构建 ARP/wARP

Phenix.autobuild

Phenix.autobuild Buccaneer

Rfree(%) 58.71 59.32 32.50 32.34

Page 5: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

流水线的架构设计

结构解析流水线的构建

算法基础: “ 参数空间及程序空间筛选”方法:结构解析流水线的后台程序会根据用户输入的空间群的数目,最高分辨率、分辨率间隔、重原子数目以及用户选择的程序自动计算出可能的参数组合,然后利用不同计算节点的对所有可能组合进行计算。

运算模式: 在高性能集群上多任务的并行计算模式。使用界面:

友好的交互式网页服务器界面。使用方式:

利用因特网实现:任务的远程提交、结果的在线查询和数据的远程下载。

At the synchrotron

At the synchrotron orhome lab

“Parameter Space Screening” method based phasing pipeline:

Liu, Z.J., Lin D., Tempel W., Praissman JL., Rosea JP. and Wang BC.,(2005) Parameter-space screening: a powerful tool for high-throughput crystal structure determination. Acta Crystallogr D Biol Crystallogr 61(Pt 5): p. 520-7. 

Page 6: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

流水线的架构设计

结果输出

重原子搜索

相位优化

相位 计算

模型构造

SHELXD 、SOLVE

SHELXE 、RESOLVE

DM , Parrot

ARP/wARP, 、 Buccaneer 、 P

henix 

登陆服务器,提交

数据

产生作业

高分辨率数据

Page 7: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

使用费用• X2DF 对学术研究者是免费的,但计算机的机时是要收取费用的,

具体费用如下 :• 中国科学院生物物理所的师生 : 0.12¥ /线程 /小时• 其他学术机构 : 0.50¥ /线程 /小时• 商业机构: 1.00¥ /线程 /小时• 最低缴费: 1000元• 户名:中国科学院生物物理研究所• 开户银行:工行东升路支行• 账号: 0200006209088116933• !!!并请特别注明:入平台晶体结构计算费• 款项汇出后请将用户名、密码和汇款金额发 EMAIL通知凌伦奖老

师。在确认收到后,我们会通知你们并出具发票。• 付费联系人:(凌伦奖): [email protected] 

• 技术支持: (丁玮): [email protected]

Page 8: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

http://zjliulab.ibp.ac.cn/

Page 9: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

登陆按钮 申请账户按钮,新用户可将用户名 (长度必须少于 8个英文字符 ) 和密码发送给管理员,以申请新用户。

帮助文档链接

http://zjliulab.ibp.ac.cn/pipeline/html/

Page 10: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

输入用户名

输入密码

登陆 索要登陆密码

Page 11: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

新建任务名

新任务描述

新建任务按钮 退出按钮

新任务名称

Page 12: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

剩余机时

已使用的机时

查看任务运行情况

删除任务

新建任务 退出

有几个作业正在运行

删除作业或刷新页面

总共购买的机时

运行的任务名(路径名)

Page 13: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

输入含反常散射的 sca 文件

输入同一颗晶体的高分辨率 sca 文件,如果没有可以再次输入第一组数据

输入该晶体的序列文件

一个分子中的残基数目

重原子类型

晶体可能的空间群,可以多选

反常散射数据收集时使用的光源波长

原始数据的最高分辨率取值(精度为小数点后 3 位)

一个非对称单元中的分子数目

一个非对称单元中重原子数目的最小可能值

分辨率筛选时可以接受的最高分辨率的最低取值

原始数据的最低分辨率取值(精度为小数点后 3 位)

一个非对称单元中重原子数目的最大可能值

分子的溶剂含量

反常散射的虚部值

分辨率筛选的递增区间

重原子搜索和相位计算的程序 电子密度优

化的程序模型构建的程序

参数计算网页: http://zjliulab.ibp.ac.cn/data_ana/phpweb/

参数提交按钮

重置按钮

Page 14: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

检查输入信息

返回上一层菜单提交任务,开始运算

任务数目单个任务的平均耗时 (预测 )

所有任务的总耗时(预测)

Page 15: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

任务提交成功

Page 16: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

结果输出界面,从左至右依次是:( 1 )重原子搜索的分辨率( 2 )相位计算的分辨率( 3 )空间群( 4 )需要搜索的重原子数目( 5 )实际搜索到的重原子数目( 6 )重原子搜索和相位计算的程序( 7 )电子密度计算的程序( 8 )模型构建的程序( 9 ) FOM 值( 10 )重构后的原子数目( 11 ) Rfree 值( 12 )耗时( 13 )文件下载链接

Page 17: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

部分结果展示Protein A B C

Wavelength(Å) 2.70 0.98 0.98

High resolution cut

(Å)3.20 3.10 2.80

Spacegroup P6122 C2221 P3221

Number of residues in

a molecules173 257 643

Copies in asymmetry

unit1 1 2

Heavy atom element

nameS Se Se

Maximum number of

heavy atom20 1 29

Page 18: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

A

Protein Wavelength(Å)

High resolution

cut (Å)

Spacegroup Number of residues in a

molecules

Copies in asymmetry

unit

Heavy atom element

name

Maximum number of

heavy atom

A 2.70 3.20 P6122 173 1 S 20

Rwork/Rfree=24.30/28.91

Page 19: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

B

Protein Wavelength(Å)

High resolution

cut (Å)

Spacegroup Number of residues in a

molecules

Copies in asymmetry

unit

Heavy atom element

name

Maximum number of

heavy atom

B 0.98 3.10 C2221 257 1 Se 1

Rwork/Rfree=27.39/32.42

Page 20: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

C

Protein Wavelength(Å)

High resolution

cut (Å)

Spacegroup Number of residues in a

molecules

Copies in asymmetry

unit

Heavy atom element

name

Maximum number of

heavy atom

C 0.98 2.80 P3221 643 2 Se 29

Rwork/Rfree=20.83/24.40

Page 21: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

成像中心软件介绍

Soft Worxhttp://

www.api.com/softworx.asp

结构照明超高分辨率荧光显微镜

Delta Visionhttp://

www.api.com/softworx.asp

荧光分子和荧光染料。比如微生物、脊椎动物细胞、组织切片甚至整个胚胎等,在对微管和肌动蛋白的观察中可以解析到单根微管纤维。

Streptococcus Cells ( 链球菌 )

Page 22: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

成像中心软件介绍

Appion( EMAN,  IMOD, 

XMIPP, Chimera… )

场发射低温透射电镜

Xplore3d, ImageJ …

低温透射电镜技术可观察快速冷冻的液体样品和经冷冻切片的含水样品,提供处于溶液环境中的大分子、大分子复合物、囊泡、细胞器、胶束等颗粒的图像。

兔出血症病毒高分辨率图像( 6.5Å )

Page 23: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

成像中心软件介绍

Auto slice and view

双束扫描电镜

Amirahttp://www.vsg3d.com/

amira/overview

可以进行二次电子形貌分析和背散射电子衬度成像分析。

Page 24: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

成像中心软件介绍

Amirahttp://www.vsg3d.com/

amira/overview

图像渲染软件

Imarishttp://www.bitplane.com/

imaris

Mouse thorax. 

vesicle

Mouse thorax. 

Page 25: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

谢谢大家!

Page 26: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

参数计算服务器http://zjliulab.ibp.ac.cn/

Page 27: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

Crystal Cloud - HT Crystallography Tool BoxData analysis system

http://159.226.118.93/data_ana/phpweb/

Page 28: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

2: Data analysis system

Jobname

X-ray Wavelength

Heavy Atom Type

Guess Heavy Atom Sites

Sca File

Sequence File

Space Group

Cell Parameters

Number of Copies in ASU

Number of residues in ASU

Low Resolution

High Resolution

Heavy Atom Element Name

Heavy Atom Sites

d"/sig(d")

Solvent Content

F Prime

F Double Prime

INPUT

OUTPUT

<2min

Page 29: 基于 参数空间筛选方法的高通量晶体结构解析流水线的 应用

2: Data analysis systemExample

BACK