Sulfur (Native)-SAD法による位相決定
第1回 タンパク質結晶構造解析ビームライン中級者向け講習会
2016.06.24
総合研究⼤学院⼤学/⾼エネ機構
原⽥ 彩佳
1
本⽇の内容
1. S (Native)-SAD法について2. 測定系の⼯夫3. 測定⼿法の⼯夫4. 解けているデータの特徴5. 実際の解析例(2つ)
2
本⽇の内容
1. S (Native)-SAD法について2. 測定系の⼯夫3. 測定⼿法の⼯夫4. 解けているデータの特徴5. 実際の解析例(2つ)
3
• セレノメチオニンタンパク質の作製がいらない• 重原子誘導体結晶の作製がいらない
メリット
S原子(硫黄)の有用性 • 生体高分子の結晶には、異常散乱を示す原子が含まれている場合が多い
デメリット • ノイズとシグナルの区別が難しい• 長波長でのデータ収集における溶媒や空気、ループによる吸収が増大してしまう
S-SAD法は硫⻩原⼦の異常散乱を利⽤する
S: タンパク質の構成原⼦(メチオニン、システイン)P: 核酸の構成原⼦
4
異常散乱の波⻑依存性
𝑓"#$% = 𝑓 + ∆𝑓 + 𝑖𝑓** = 𝑓* + 𝑖𝑓′′
0.9795 Åf’’= 3.8
5.0155 Åf’’= 4.1
硫黄原子の吸収端波長での回折強度データ収集を行うことができないので、利用可能な波長でデータ収集を行う必要がある。
Up to 3.3 Å @ BL1A
原子散乱因子
5
BL-1AとBL-17Aで利⽤可能な⻑波⻑
0.9795 Åf’’= 3.8
2.7000 Åf’’= 1.5
1.9000 Åf’’= 0.3
波長2.7000Åを利用しても、S原子の異常散乱シグナルはSe原子のピーク波長でのシグナルの半分以下であり、シグナルとノイズの区別が難しい。
𝑓"#$% = 𝑓 + ∆𝑓 + 𝑖𝑓** = 𝑓* + 𝑓′′原子散乱因子
6
本⽇の内容
1. S (Native)-SAD法について2. 測定系の⼯夫3. 測定⼿法の⼯夫4. 解けているデータの特徴5. 実際の解析例(2つ)
7
入射X線Loop
空気からの散乱
クライオガスからの散乱
Liu et al., 2013
波長エネルギーに対するX線透過率( %)
測定系の⼯夫:Heチャンバーの利⽤
通常の測定系で⽣じる問題1. 空気中では⼊射X線のX線透過率が下がる → X線強度の低下2. クライオガスの散乱が検出器に⼊る → ノイズの増加
BL-1Aの完全ヘリウム環境下回折計
~50%@ 2.7000 Å
~70%@ 1.9000 Å
8
本⽇の内容
1. S (Native)-SAD法について2. 測定系の⼯夫3. 測定⼿法の⼯夫4. 解けているデータの特徴5. 実際の解析例(2つ)
9
Mueller et αl., 2011
Fine φSlicing 測定を行うことで、結晶のモザイク幅よりも小さな振動角(φ)で回折強度データを収集する。
測定⼿法の⼯夫:Fine φ Slicing 測定
Δφ= 1.0°で0-360°分データ収集
360×1 = 360 img 360×10 = 3600 img
Δφ= 0.1°で0-360°分データ収集
10
測定⼿法の⼯夫:Multiplicityをかせぐ
振動⾓= 0.1°露光時間= 0.1 secX線透過率= 5 %回折強度データ= 360°×10
VS振動⾓= 0.1°露光時間= 0.1 secX線透過率= 50 %回折強度データ= 360°×1
薄焼き条件 よく焼き条件
1周目:
10周目 :
1周
よく焼き条件
0 ° 360°
薄焼き条件
11
薄焼き vs よく焼き
Data set A B
Wavelength (Å) 2.700Beam size (μm2) 13 x 13Transmittance (%) 35.1 12.3Osc. width (deg.) 0.5Exp. time (sec.) 0.25Oscillation range (deg.) 360 360 x 3
13 μm
13 μm
12
よく焼き (データセットA)
RESOLUTION NUMBER OF REFLECTIONS COMPLETENESS R-FACTOR R-FACTOR COMPARED I/SIGMA R-meas CC(1/2) Anomal SigAno NanoLIMIT OBSERVED UNIQUE POSSIBLE OF DATA observed expected Corr12.24 4711 274 277 98.9% 9.9% 7.6% 4711 40.55 10.2% 99.7* 81* 2.686 788.65 10500 514 514 100.0% 9.5% 7.7% 10500 44.53 9.7% 99.7* 79* 2.497 1907.06 13433 642 642 100.0% 8.8% 7.7% 13433 44.09 9.0% 99.8* 78* 2.308 2566.12 16205 776 779 99.6% 8.3% 7.8% 16205 43.23 8.5% 99.9* 82* 2.363 3225.47 18751 880 882 99.8% 7.6% 7.8% 18751 43.98 7.8% 99.9* 78* 2.003 3735.00 20693 979 980 99.9% 6.8% 7.8% 20693 43.53 6.9% 99.9* 81* 1.812 4234.62 19400 1051 1051 100.0% 6.2% 7.7% 19400 40.83 6.3% 99.9* 78* 1.580 4584.33 22396 1133 1134 99.9% 5.6% 7.7% 22396 42.48 5.8% 99.9* 70* 1.384 4984.08 21491 1203 1204 99.9% 5.4% 7.7% 21491 40.41 5.6% 99.9* 69* 1.318 5373.87 24195 1281 1282 99.9% 5.6% 7.8% 24195 40.98 5.7% 99.9* 69* 1.366 5733.69 25490 1333 1335 99.9% 5.4% 7.8% 25490 40.44 5.6% 99.9* 73* 1.420 5993.53 26747 1395 1397 99.9% 5.9% 7.8% 26747 40.10 6.1% 99.9* 74* 1.490 6333.39 27628 1471 1471 100.0% 6.0% 7.9% 27627 38.78 6.2% 99.9* 72* 1.429 6653.27 27724 1515 1520 99.7% 6.5% 8.0% 27724 37.06 6.7% 99.9* 72* 1.516 6933.16 27485 1566 1573 99.6% 7.2% 8.1% 27485 35.46 7.4% 99.9* 75* 1.661 7183.06 27496 1631 1642 99.3% 7.8% 8.2% 27493 33.78 8.0% 99.8* 71* 1.706 7502.97 22512 1651 1673 98.7% 8.3% 8.4% 22508 28.55 8.6% 99.8* 77* 1.929 7592.88 17604 1681 1740 96.6% 9.2% 8.5% 17596 24.00 9.6% 99.6* 76* 1.937 7712.81 10499 1622 1770 91.6% 9.2% 8.5% 10483 17.85 9.9% 99.3* 75* 1.991 7412.74 3401 1284 1834 70.0% 8.3% 7.8% 3184 10.89 10.2% 98.4* 64* 1.610 432total 388361 23882 24700 96.7% 6.7% 7.80% 88112 34.90 6.9% 99.9* 75* 1.705 469
13
薄焼き (データセットB)
RESOLUTION NUMBER OF REFLECTIONS COMPLETENESS R-FACTOR R-FACTOR COMPARED I/SIGMA R-meas CC(1/2) Anomal SigAno NanoLIMIT OBSERVED UNIQUE POSSIBLE OF DATA observed expected Corr
12.23 14682 272 275 98.9% 11.1% 8.8% 14682 61.41 11.2% 99.9* 92* 4.000 778.65 32172 512 513 99.8% 10.9% 8.8% 32172 66.56 11.0% 99.9* 85* 3.222 1897.06 40731 641 642 99.8% 10.3% 9.0% 40731 63.11 10.4% 99.9* 87* 2.969 2566.11 48979 778 780 99.7% 10.0% 9.3% 48979 59.28 10.0% 99.9* 87* 3.097 3225.47 56157 879 879 100.0% 9.4% 9.4% 56157 60.16 9.4% 99.9* 86* 2.476 3734.99 62212 978 981 99.7% 8.6% 9.4% 62212 59.96 8.6% 99.9* 84* 2.280 4224.62 58582 1052 1052 100.0% 7.6% 9.2% 58582 56.94 7.7% 99.9* 83* 2.039 4594.32 66875 1125 1127 99.8% 7.1% 9.2% 66875 59.30 7.2% 100.0* 75* 1.706 4964.08 64791 1204 1204 100.0% 7.1% 9.3% 64791 56.09 7.1% 99.9* 73* 1.544 5373.87 73041 1284 1285 99.9% 7.4% 9.5% 73041 55.85 7.5% 100.0* 70* 1.581 5733.69 76762 1332 1333 99.9% 7.4% 9.6% 76762 54.04 7.5% 100.0* 71* 1.607 5993.53 80758 1392 1394 99.9% 8.0% 9.8% 80758 53.18 8.1% 99.9* 68* 1.479 6313.39 83129 1462 1463 99.9% 8.3% 10.0% 83129 50.45 8.4% 99.9* 75* 1.682 6603.27 85147 1524 1534 99.3% 9.0% 10.3% 85147 47.38 9.1% 99.9* 68* 1.617 6993.16 84062 1563 1570 99.6% 10.2% 10.9% 84059 43.98 10.3% 99.9* 70* 1.679 7153.06 83105 1611 1625 99.1% 11.2% 11.5% 83105 40.53 11.3% 99.9* 72* 1.803 7412.97 69790 1658 1678 98.8% 12.1% 12.1% 69790 33.14 12.3% 99.9* 68* 1.751 7652.88 54469 1683 1733 97.1% 13.7% 13.1% 54468 26.84 13.9% 99.7* 64* 1.703 7802.81 32767 1657 1767 93.8% 14.8% 13.9% 32767 18.89 15.2% 99.5* 58* 1.666 7672.73 11035 1485 1837 80.8% 16.4% 14.6% 11022 10.28 17.6% 98.1* 34* 1.333 681total 1179246 24092 24672 97.6% 8.9% 9.9% 1179229 45.14 8.9% 99.9* 69* 1.825 742
14
S-SAD法のためのデータ収集プロトコル
1. 波⻑は2.7 Åまたは1.9 Å2. 低線量(Transmittance: ~5 %)で360度x5回のデータ
セット収集3. 放射線損傷の有無をチェックして測定回数を決定4. 複数の位置、複数の結晶から多量のデータセットを収集5. マージ(平均化)する
360 度 x 5360 度 x N 360 度 x N
15
本⽇の内容
1. S (Native)-SAD法について2. 測定系の⼯夫3. 測定⼿法の⼯夫4. 解けているデータの特徴5. 実際の解析例(2つ)
16
異常分散シグナルの⾒積もり
𝐹"#$%𝐹 = 2
. /⁄ ×𝑁3 . /⁄ ×𝑓′′𝑁4 . /⁄ ×𝑍677
Bijvoet ratio
Bijvoet Difference
|𝐹"#$%|
FHCCrickandBSMagdoff (1956)
NA : 異常散乱原子の数NT : 1分子中に含まれる原子の数f“ : 測定波長における異常分散の寄与Zeff : 平均的なタンパク質原子の電子数 (6.7)
17
S-SAD法により最初に決められた構造
PDB ID : 1CRN
MW (kDa): 4.74
>1CRN:A|PDBID|CHAIN|SEQUENCE
TTCCPSIVARSNFNVCRLPGTPEAICATYTGCIIIPGATCPGDYAN
λ= 1.54 Å
Bijvoet ratio= 2.53 %
Hendrickson & Teeter (1981)18
S-SAD法により解かれた構造 (PDB)
0 10 20 30 40 50 60 70 80 90 100 110 120 130
0 25 50 75 100 125 150 175 200 225 250 275 300
Sub-structureの数
非対称単位中の分子量 (kDa)
非対称単位の分子量 (kDa) vs Sub-structureの数
PDB:Weinert et al., 201519
Lattice Type Laue Class Space Group (例) Symmetry Operation Multiplicity PDBTriclinic -1 P1 1 2 0
Monoclinic 2/m P2, C2 2 4 11
Orthorhombic mmm P222, C222, I222, F222
4 8 33
Tetragonal 4/m P4, I4 4 8 2
4/mmm P422, I422 8 16 16
Trigonal -3 P3 3 6 2
-31m P312 6 12 0
-3m1 P321 6 12 11
Hexagonal 6/m P6 6 12 5
6/mmm P622 12 24 8
Rhombohedral -3 R3 (H3) 6 12 1
-3m1 R32 (H32) 6 12 1
Cubic m-3 P23, I23, F23 12 24 2
m-3m P432, I432, F432 24 48 0
S-SAD法により解かれた構造と空間群
20
S-SAD法で解かれた構造(PF)
タンパク質名 空間群 格⼦定数
⾮対称単位中の分⼦量 (kDa)
⾮対称単位中のSub-structureの数
測定波⻑(Å)
バイフット⽐(%)
proteinA P21212 a=102, b=118, c=127 157 42 1.9000 1.05
proteinB P41212 a=b=84, c=100 28 8 1.9000 1.08
proteinC P65 a=b=184, c=54 109 48 1.9000 1.34
proteinD P212121 a=63, b=128, c=176 144 76 1.9000 1.47
proteinE C2 a=196, b=50, c=52, β=92.8 110 52 1.9000 1.39
protein A' P212121 a=112, b=126, c=155 209 56 2.7000 1.97
protein D' P212121 a=63, b=128, c=176 144 76 2.7000 2.75
protein E' C2 a=196, b=50, c=52, β=92.8 110 52 2.7000 2.61
protein F P212121 a=77, b=120, c-255 198 36 2.7000 1.61
protein G P6422 a=b=79, c=125 25 10 2.7000 2.39
protein H P6522 a=b=97, c=270 68 35 2.7000 2.71
protein I P4132 a=b=c=192 100 48 2.7000 2.62
21
S-SAD法で解かれた構造(PF)
非対称単位中の分子量が大きいものについて構造決定できている
0
10
20
30
40
50
60
70
80
90
100
110
120
0 25 50 75 100 125 150 175 200 225 250 275 300
Sub-structureの数
非対称単位中の分子量 (kDa)
非対称単位中の分子量 vs sub-structureの数
PDBKEK-PF@BL17AKEK-PF@BL-1A
PDB:Weinert et al., 201522
本⽇の内容
1. S (Native)-SAD法について2. 測定系の⼯夫3. 測定⼿法の⼯夫4. 解けているデータの特徴5. 実際の解析例(2つ)
23
位相決定までの流れ
Diffraction Data
XDS
XSCALE
XDSCONV
SHELXC/D/E
24
Example 1
25
2.6 Å
2.9 Å
回折強度データの収集条件
Data CollectionProtein Protein A
Residues/ASU 1884 (471/molecule)
Sulfurs/ASU 56 (14/molecule)
Beam line BL-1A
Wavelength (Å) 2.7000
Exp. time (s) 1.0
Osc. angle (°) 1.0
Transmittance (%) 1.0
Data collection range (°) 0 - 360
Space Group P212121Cell parameter a=112, b=126, c=154
α = β = γ = 90.0
< |𝐹"#$% | >∕< |𝐹| >= 1.98%
26
回折強度データ収集⽅法
7ヶ所から合計30データセットを収集
25 μm
10 μm
1ヶ所につき4-5周回折強度データを収集し、7ヶ所から合計30データセットを収集した。
Multiplicity = 19627
XSCALEによるスケーリング
1データセット
30データセットRESOLUTION NUMBER OF REFLECTIONS COMPLETENESS R-FACTOR R-FACTOR COMPARED I/SIGMA R-meas CC(1/2) Anomal SigAno Nano
LIMIT OBSERVED UNIQUE POSSIBLE OF DATA observed expected Corr12.97 154549 760 1047 72.60% 8.80% 10.30% 154549 72.97 8.90% 100.0* 83* 3.459 3159.17 420257 1913 1913 100.00% 9.60% 10.80% 420257 77.5 9.60% 100.0* 76* 2.851 8407.49 560765 2496 2496 100.00% 12.60% 12.90% 560765 72.06 12.60% 100.0* 73* 2.736 11316.48 670916 2961 2961 100.00% 16.90% 17.20% 670916 59.01 16.90% 100.0* 75* 2.547 13635.8 714831 3334 3334 100.00% 18.80% 18.90% 714831 53.86 18.90% 100.0* 68* 2.364 15515.29 707577 3681 3681 100.00% 18.40% 18.20% 707577 52.44 18.40% 100.0* 65* 2.106 17224.9 838393 4016 4017 100.00% 16.30% 16.20% 838393 60.28 16.40% 100.0* 64* 2.162 18904.59 903430 4294 4303 99.80% 15.40% 15.10% 903429 64.52 15.40% 100.0* 61* 1.985 20294.32 864760 4566 4574 99.80% 15.40% 15.10% 864760 61.79 15.40% 100.0* 54* 1.873 21684.1 908748 4847 4894 99.00% 16.40% 16.20% 908748 57.07 16.40% 100.0* 53* 1.797 23053.91 998263 5044 5082 99.30% 18.50% 18.50% 998263 52.53 18.50% 100.0* 42* 1.673 24003.74 1064492 5295 5330 99.30% 21.00% 21.30% 1064491 47.11 21.10% 100.0* 39* 1.475 25313.6 1125219 5520 5586 98.80% 23.20% 23.70% 1125219 44.25 23.20% 100.0* 34* 1.389 26483.47 1166390 5725 5807 98.60% 24.30% 25.20% 1166390 41.52 24.30% 100.0* 35* 1.345 27483.35 1203716 5901 6008 98.20% 26.00% 26.70% 1203715 40.16 26.10% 100.0* 32* 1.329 28323.24 1091963 6044 6169 98.00% 29.30% 30.10% 1091961 34.04 29.30% 99.9* 31* 1.236 29033.15 1176174 6261 6410 97.70% 32.20% 33.50% 1176172 31.46 32.30% 99.9* 30* 1.201 30033.06 1233407 6397 6582 97.20% 35.10% 36.40% 1233406 29.47 35.20% 99.9* 26* 1.142 30712.98 1148927 6580 6803 96.70% 40.80% 42.30% 1148926 24.48 40.90% 99.9* 28* 1.111 31562.9 1183409 6637 6896 96.20% 47.00% 48.50% 1183407 21.46 47.10% 99.8* 31* 1.128 3191total 18136186 92272 93893 98.30% 22.50% 22.90% 18136175 44.83 22.50% 100.0* 46* 1.606 43797
RESOLUTION NUMBER OF REFLECTIONS COMPLETENESS R-FACTOR R-FACTOR COMPARED I/SIGMA R-meas CC(1/2) Anomal SigAno NanoLIMIT OBSERVED UNIQUE POSSIBLE OF DATA observed expected Corr6.91 50506 6967 6985 99.70% 8.10% 7.50% 50506 17.91 8.70% 99.7* 25* 1.063 30824.91 86115 12481 12482 100.00% 11.80% 11.40% 86112 13.51 12.80% 99.5* 18* 0.959 58344.02 104104 15964 16078 99.30% 10.40% 10.10% 104050 14.65 11.30% 99.5* 12* 0.901 75423.48 127280 18844 19086 98.70% 14.20% 14.10% 127184 11.05 15.40% 99.3* 10 0.852 89573.12 135858 21089 21609 97.60% 19.50% 19.30% 135729 8 21.30% 98.7* 7 0.825 100312.85 139935 22703 23889 95.00% 29.40% 28.90% 139530 5.1 32.10% 97.2* 4 0.791 106762.64 145040 23915 25905 92.30% 46.40% 45.00% 144340 3.09 50.70% 93.3* 10* 0.829 111462.47 143621 24874 27914 89.10% 79.20% 78.00% 142479 1.67 86.90% 82.9* 7 0.761 113792.33 68706 20398 29659 68.80% 97.20% 100.00% 64280 0.87 112.70% 62.8* 6 0.731 7374total 1001165 167235 183607 91.10% 20.90% 20.50% 994210 6.89 22.80% 98.8* 9 0.833 76021
Outershell Rmerge <0.5 Resolutioncut-off:2.9Å
28
統計値について: SigAno
0.8
1.3
1.8
2.3
2.8
3.3
3.8
2.53.54.55.56.57.58.59.510.511.512.513.5
SigA
no
Resolution (Å)
SigAno vs Resolution
data10data15data20data25data30
𝑆𝑖𝑔𝐴𝑛𝑜 = (|𝐹 H | − |𝐹 J |) 𝜎(∆𝐹)⁄
|F(+)|−|F(-)|≈|F(sub)|Substructure
異常分散シグナルのS/N比
29
統計値について: I/sigma
5
15
25
35
45
55
65
75
2.53.54.55.56.57.58.59.510.511.512.513.5
I/sig
ma
Resolution (Å)
I/sigma vs Resolution
data10data15data20data25data30
𝐼/𝑠𝑖𝑔𝑚𝑎 = < 𝐼 > 𝜎 < 𝐼 >⁄
データのSN比もデータをマージすればするほど高くなる
30
SHELXC
SigAno < 0.8はノイズ。1.2σ以上で分解能3.4 Åを示した。
分解能3.4 Å
>1.2
SHELXC.log
31
SHELXD:CCall vs CCweak
CCall:全反射を使ったCC値CCweak:強度の弱い反射のみを使ったCC値のプロットで正しい解を見つけているか判断する。
正しい座標を見つけられている
正しい解を見つけられていない
32
SHELXD-Grid Search
分解能とSub-structureの値を、それぞれ幅広く振りSHELXDをかける
分解能 : 2.9 - 4.0 Å ( 0.1 Å 刻み)Sub-structure の個数:12 – 56個
試した条件
24個 28個 36個 42個 48個 56個
2.9 Å
3.1 Å
3.2 Å
3.3 Å
3.4 Å
3.0 Å
6/6
6/6
0/6
2/6
3/6
0/6 33
ARP/wARPによるモデル構築
1792/1853 sequencedRwork/Rfree = 28/34 (%)
SHELXD で求めたSub-structureの位相改良後、ARP/wARPを⽤いてモデル構築を⾏うことができた。
位相改良後の電⼦密度図
ARP/wARP
34
Example 2
35
Data Collection
Protein Protein B
Residues/ASU 1804 (451/molecule)
Sulfurs/ASU 36 (9/molecule)
Beam line BL-1A
Wavelength (Å) 2.7000
Exp. time (s) 0.1
Osc. angle (°) 0.2
Transmittance (%) 10
Data collection range (°) 0 - 360
Space Group P212121Cell parameter a=77, b=119, c=255
α = β = γ = 90.0
< |𝐹"#$% | >∕< |𝐹| >= 1.61% 0.5mm
f’’ (Zn)=1.9f’’ (S)=1.5
回折強度データの収集条件
2.7000 Å
36
回折強度データ収集⽅法
1ヶ所につき2-3周回折強度データを収集し、4ヶ所から合計10データセットを収集した。
3.1 Å
Multiplicity = 6637
SHELXC
分解能 3.5 Å
5データセット:Multiplicity=34
XSCALEによるスケーリング
38
SHELXD(デフォルト設定)
SHELXD-Grid Search
SHELXD-分解能: 3.5 ÅSub-structure の個数: 36
1712/1789 sequencedRwork/Rfree = 25/30 (%)
SHELXD-Grid Searchを⾏った結果、ほぼ全ての範囲で正しい解を⾒つけることができた。
ARP/wARP
39
まとめ
S(Native)-SAD法による位相決定
1. Heチャンバーの利⽤2. Fine φ Slicing3. 薄焼き測定4. SHELXD-Grid Search
40
謝辞
高エネ研/構造生物学研究センター
教授 千田 俊哉
准教授 松垣 直宏
助教 山田 悠介
博士研究員 Dorothee Liebschner (現 LBNL)
41