6
610 药物发现中的代谢轮廓分析 : 了解代谢组学研究的影响因素与降低生物化学和化 学噪音的策略 关键词 Q Exactive FocusSIEVE 软件; 生物标记物;药物发现;代谢组学 目的 为代谢组学生物标记物的发现开发一套全新的自动化工作 流程和仪器分析方法。 样品前处理 抽取各组雄性大鼠(饱食,急慢性禁食,不同年龄)的 血液样品并进行 LC-MS 分析。取 50 μL 血清样品,加入 100 μL 0.1% 甲酸的冷甲醇溶液以除去蛋白质。干燥样品,加入 200 μL10% 甲醇水溶液复溶。每份样品中加入 N- 苯甲酰基 -D5- 甘氨酸(tR = 4.27 minm/z 185.0969)作为内标。 实验部分 Mark Sanders 1 , Serhiy Hnatyshyn 2 , Don Robertson 2 , Michael Reily 2 , Thomas McClure 1 , Michael Athanas 3 , Jessica Wang 1 , Pengxiang Yang 1 , Yingying Huang 1 , David Peake 1 ; 1 Thermo Fisher Scientific, San Jose, CA; 2 Bristol-Myers Squibb, Princeton, NJ; 3 Vast Scientific, Boston, MA 前言 在制药行业中,代谢组学用于研究潜在候选药物的药理学 响应所产生的生化变化,其识别毒性 / 药效标记物的能力可以 显著加速药物研发的进程并帮助制定合适的临床计划。来自于 液相色谱 - 质谱联用技术(LC-MS)的代谢轮廓实验数据,包 含大量的化学噪音,常常干扰生物标记物的发现。本文采用全 新的质谱技术和数据处理软件来降低动物实验中的化学背景, 进而研究药物诱导的变化与动物年龄和营养的关系。 常规 LC-MS 代谢组学研究存在很多冗余的(一种组分有 多个离子)和不相关的(化学噪音)数据。同时影响代谢轮廓 的外部因素(年龄、营养)增加了生物多变性。由于许多化学 物质是未知的,因此,在进行结构鉴定前过滤掉假阳性结果尤 为重要。超高分辨率仪器结合超高效液相色谱(UHPLC)的 分离可以提供足够的分辨率将代谢物与化学背景区分开,解决 了化学噪音和数据冗余的问题。准确质量数能确保识别相关信 号所需要的精细数据处理。此技术可大大减少数据量,并改进 目标代谢物的定量。生物因素对代谢轮廓有着深远的影响,即 使细小的代谢变化也会掩盖药物诱导的代谢效应。了解大鼠的 正常代谢变化能使“生物噪音”降到最低,并提供更为可靠的 药物相关的代谢变化信息。

药物发现中的代谢轮廓分析 了解代谢组学研究的影响因素与降低生物化学和化 学 … · 物噪音的表征,同时代谢组学预筛选功能帮助鉴定出生物离群

  • Upload
    others

  • View
    26

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 药物发现中的代谢轮廓分析 了解代谢组学研究的影响因素与降低生物化学和化 学 … · 物噪音的表征,同时代谢组学预筛选功能帮助鉴定出生物离群

应用文献610

药物发现中的代谢轮廓分析 : 了解代谢组学研究的影响因素与降低生物化学和化学噪音的策略

关键词

Q Exactive Focus;SIEVE 软件;

生物标记物;药物发现;代谢组学

目的

为代谢组学生物标记物的发现开发一套全新的自动化工作

流程和仪器分析方法。

样品前处理

抽取各组雄性大鼠(饱食,急慢性禁食,不同年龄)的

血液样品并进行 LC-MS 分析。取 50 µL 血清样品,加入 100

µL 含 0.1% 甲酸的冷甲醇溶液以除去蛋白质。干燥样品,加入

200 µL10%甲醇水溶液复溶。每份样品中加入N-苯甲酰基 -D5-

甘氨酸(tR = 4.27 min,m/z 185.0969)作为内标。

实验部分

Mark Sanders1, Serhiy Hnatyshyn2, Don Robertson2, Michael Reily2, Thomas McClure1,

Michael Athanas3, Jessica Wang1, Pengxiang Yang1, Yingying Huang1, David Peake1;1Thermo Fisher Scientific, San Jose, CA; 2Bristol-Myers Squibb, Princeton, NJ; 3Vast Scientific, Boston, MA

前言

在制药行业中,代谢组学用于研究潜在候选药物的药理学

响应所产生的生化变化,其识别毒性 / 药效标记物的能力可以

显著加速药物研发的进程并帮助制定合适的临床计划。来自于

液相色谱 - 质谱联用技术(LC-MS)的代谢轮廓实验数据,包

含大量的化学噪音,常常干扰生物标记物的发现。本文采用全

新的质谱技术和数据处理软件来降低动物实验中的化学背景,

进而研究药物诱导的变化与动物年龄和营养的关系。

常规 LC-MS 代谢组学研究存在很多冗余的(一种组分有

多个离子)和不相关的(化学噪音)数据。同时影响代谢轮廓

的外部因素(年龄、营养)增加了生物多变性。由于许多化学

物质是未知的,因此,在进行结构鉴定前过滤掉假阳性结果尤

为重要。超高分辨率仪器结合超高效液相色谱(UHPLC)的

分离可以提供足够的分辨率将代谢物与化学背景区分开,解决

了化学噪音和数据冗余的问题。准确质量数能确保识别相关信

号所需要的精细数据处理。此技术可大大减少数据量,并改进

目标代谢物的定量。生物因素对代谢轮廓有着深远的影响,即

使细小的代谢变化也会掩盖药物诱导的代谢效应。了解大鼠的

正常代谢变化能使“生物噪音”降到最低,并提供更为可靠的

药物相关的代谢变化信息。

Page 2: 药物发现中的代谢轮廓分析 了解代谢组学研究的影响因素与降低生物化学和化 学 … · 物噪音的表征,同时代谢组学预筛选功能帮助鉴定出生物离群

液相色谱

采用 Thermo ScientificTM Open AccelaTM 1250 UHPLC 系统

和 Thermo ScientificTM Hypersil GOLDTM aQ 色谱柱(150 × 2.1

mm, 1.9 µm粒径)进行色谱分离。进样量为3 µL。色谱条件如下:

流速: 600 µL/min

柱温: 50 ℃

溶剂 A: 0.1% 甲酸水溶液

溶剂 B: 0.1% 甲酸乙腈溶液

梯度: 时间(min) %A %B

0 100 0

6 80 20

8 40 60

12 5 95

14 5 95

17 100 0

质谱

采用Thermo ScientificTM Q ExactiveTM Focus Hybrid Quadrupole-

Orbitrap 质谱仪(图 1)分别在正离子和负离子模式下采集得到高

分辨率准确质量数(HRAM)数据,分辨率为 70,000(FWHM)。

图 1. Q Exactive Focus 质谱仪示意图

数据处理

采 用 Thermo ScientificTM SIEVETM 软 件 的 组 分 提 取

(Component Extraction, CE)数据处理算法分析数据,测定

大鼠禁食产生的代谢效应。

结果与讨论图 2 显示了 N- 苯甲酰基 -D5- 甘氨酸内标物的高质量

LC-MS 数据。在质量轴校准后的 25 到 35 小时之间采集血清

QC 重复样的正离子模式数据,展示了 UHPLC 分析时间内优异

的峰面积和质量数测定的稳定性。基线处的色谱峰宽为 3.6 s,

每个峰获得了 15 次扫描。

图 3 显示了测定内源代谢物的元素组成时分辨率为

70,000 的重要性。A+2 同位素(m/z 313)附近的展开图中显

示存在一个 34S,这在 35,000 分辨率下(模拟)是不可能发现

的,因为分辨率较低时,13C2 同位素与 34S 是不能分辨的。

HCD 碰撞池 四极杆质量过滤器

Orbitrap 质量分析器

RF 透镜离子源

C 形阱

Page 3: 药物发现中的代谢轮廓分析 了解代谢组学研究的影响因素与降低生物化学和化 学 … · 物噪音的表征,同时代谢组学预筛选功能帮助鉴定出生物离群

311.0 311.5 312.0 312.5 313.0 313.5

311.1689

312.1715

313.1641

313.14 313.16 313.18 313.20m/z

313.1641

313.1741

34S

13C2

313.10 313.15 313.20 313.25m/z

313.1669

311.0 311.5 312.0 312.5 313.0 313.5

311.1689

312.1715

313.1641

313.14 313.16 313.18 313.20m/z

313.1641

313.1741

34S

13C2

313.10 313.15 313.20 313.25m/z

313.1669

313.10 313.15 313.20 313.25

313.1669

313.10 313.15 313.20 313.25m/z

313.1669

m/z

Calc. profileC17H27O3S

Exp. (blue)Calc. (red)Exp. (blue)Calc. (red)

Calc. profileC17H27O3SCalc. profileC17H27O3S

Exp. (blue)Calc. (red)

100

100

100

Rela

tive

Abun

danc

e

100

100 95,693,541-1.0% CV

96,475,711-0.2% CV

95,147,394-1.6% CV 95,147,394-1.6% CV

98,394,592+1.8% CV

97,722,945+1.1% CV

4.15 4.20 4.25 4.30 4.35 4.40

Time (min)

7:51 PM(~25 hr post

externalcalibration)

11:14 PM

1:23 AM1:23 AM

5:59 AM(~35 hr post

externalcalibration)

3:50 AM

-0.27 ppm

-0.59 ppm

-0.27 ppm

-0.92 ppm

-0.43 ppm

+0.16 ppm

-0.21 ppm

-0.05 ppm

-0.59 ppm

-0.21 ppm

Mean 185.09681-0.50 ppm

Mean 186.10023-0.18 ppm

Peak Width - 3.6 secMean Scans - 14.5

185.0 185.5 186.00

0

0

0

0

2.0x106185.09685

186.10029

185.09679

186.10022

185.09685

186.10025

185.09673

186.10015

185.09682

186.10022

2.0x106

2.0x106

2.0x106

2.0x106

m/z

0

0

0

0

Mean Area96,686,8371.41% CV

图 2. N- 苯甲酰基 -D5- 甘氨酸的质量数和响应值的稳定性,外标法,分辨率为 82,000 FWHM。

图 3. 同位素精细结构结合准确质量数测定清晰鉴定出了元素组成,如 70,000 分辨率能将 34S

同位素从 13C2 同位素中分离出来,而 35,000 分辨率不能。

70,000 分辨率下的

A+2 同位素

35,000 分辨率下的

A+2 同位素

Page 4: 药物发现中的代谢轮廓分析 了解代谢组学研究的影响因素与降低生物化学和化 学 … · 物噪音的表征,同时代谢组学预筛选功能帮助鉴定出生物离群

组分提取软件的数据处理工作流程如图 4 所示。该软件能

像分析人员一样解析数据,批量处理各个数据文件,而不是单

独处理,并将每次运行得到的信息用于验证下一次运行获得的

信息。按照这种方式,由于每种组分在数据集中的最大浓度点

定义,从而大大减小了数据缺失值现象。同样的组分在低浓度

样品中时,可以采用更靶标性的方法实现鉴定和定量。

实验得到高度简化的数据。数据处理去除了系统产生的大

量噪音,得到了更严格的统计学分组和更可靠的差异分析和组

分推断结果。

表 1 中的大鼠研究实验用于监测禁食对大鼠代谢过程的影

响。图 5 显示了喂养大鼠控制样组、混合 QC 样和禁食 4、12

和 16 小时血清样主成分分析(PCA)的高质量聚类分析结果。

结果清晰地显示了喂养和禁食大鼠血清代谢组的区别,以及不

同禁食时间的代谢组差异。图 6 显示了随禁食时间变化增加

(Met 甲硫氨酸,20:4 FA 二十碳四烯酸)和减少(Pro 脯氨酸,

18:2 LPC 溶血磷脂酰胆碱)的代谢物。如图 6 所示,混合血

清 QC 重复样中的每种代谢物均呈现极佳的重现性。因此,没

有必要做技术性重复样。图 7 说明在实际 LC-MS 分析中,尽

管正离子和负离子模式的运行时间相隔 30 小时,血清中尿酸

的测定结果在两种模式下仍然一致。研究证实,该 LC-MS 平

台和方法非常耐用。从而推断生物多变性是这些数据中噪音的

主要来源。

结论Q Exactive Focus 质谱仪为非靶标代谢组学研究提供了一

种精密和耐用的平台。此平台拥有与 UHPLC 兼容的超快扫描

速度,能在外标法校准后的相当长时间内,在正离子和负离子

两种模式下均保持优异的质量数准确度和响应值稳定性。不需

要做技术性重复样。高达 70,000 FWHM 的分辨能力能测定精

细同位素轮廓,有助于清晰地推断元素组成。若要消除研究中

大量的噪音干扰,可以采用 SIEVE 软件中的智能化数据简化工

具来实现化学噪音的显著降低。此外,系统化的研究有助于生

物噪音的表征,同时代谢组学预筛选功能帮助鉴定出生物离群

值,从而确保整个研究的一致性。

如本研究所示,禁食是模型设计中的一个显著变量,禁食

数据有助于分析很多由药物引起的代谢物变化。研究发现,大

鼠禁食对代谢轮廓分析有着深远的影响。虽然大多数代谢变化

在一定程度上是比较细微的,但是禁食能突显或掩盖掉一些药

物引起的代谢影响。

Page 5: 药物发现中的代谢轮廓分析 了解代谢组学研究的影响因素与降低生物化学和化 学 … · 物噪音的表征,同时代谢组学预筛选功能帮助鉴定出生物离群

Controls - Fed 16hr – Fast

4hr – Fast

12hr – Fast

Pooled QC

Background SubtractionBased on a series of blank runs

Start with Most Abundant IonExtracted ion traces

Automatically Interpret SpectraCharge state, adducts, isotopes

confirm chromatographic co-elution

Elucidate Monoisotopic Adduct Ion Add to Component ListQuantitative comparison

Chromatographic AlignmentSearch for missing components

Annotate ComponentsLocal database or

ChemSpider search

Peak Area NormalizationTotal useful signal or internal std

Build Quantitation TableAll components and samples

statistically significant differences

Background SubtractionBased on a series of blank runs

Start with Most Abundant IonExtracted ion traces

Automatically Interpret SpectraCharge state, adducts, isotopes

confirm chromatographic co-elution

Elucidate Monoisotopic Adduct Ion Add to Component ListQuantitative comparison

Chromatographic AlignmentSearch for missing components

Peak Area NormalizationTotal useful signal or internal std

Build Quantitation TableAll components and samples

statistically significant differences

Background SubtractionBased on a series of blank runs

Background SubtractionBased on a series of blank runs

图 4. 具有组分解析算法的 SIEVE 软件数据处理流程。

图 5. LC-MS 负离子模式下大鼠血清数据的主成分分析(PCA)。

表 1. 大鼠禁食研究实验设计

* 大鼠在晚上 6:00 到早上 6:00 暗周期

内禁食,以获得摄食高峰时间。

组别雄性大鼠数量,n

禁食时间 *

1: 1101-1105 5暗周期控制(无禁食)

2: 2101-2105 5 2 小时禁食

3: 3101-3105 5 4 小时禁食

4: 4101-4105 5 8 小时禁食

5: 5101-5105 5 12 小时禁食

6: 6101-6105 5 16 小时禁食

色谱峰对齐

校准保留时间偏差

填充数据缺口

搜索缺失的组分

建立定量表格

所有组分和样品

统计学存在显著性差异

峰面积归一化

所有有用的信号或内标物组分鉴定

搜索 ChemSpider 或本地数据库

KEGG 通路匹配

背景扣除

基于一系列空白进样

从丰度最大的离子开始

提取离子谱图

自动解析图谱

电荷价态,加合离子,同位素

确证色谱峰的共流出

阐明单同位素加合离子

添加到组分列表中

定量比较

Page 6: 药物发现中的代谢轮廓分析 了解代谢组学研究的影响因素与降低生物化学和化 学 … · 物噪音的表征,同时代谢组学预筛选功能帮助鉴定出生物离群

QC Blank DC 2h 4h 8h 12h

40,000,000

QC Blank DC 2h 4h 8h 12h

QC Blank DC 2h 4h 8h 12h

QC Blank DC 2h 4h 8h 12h

50,000,000

100,000,000

150,000,000

200,000,000

250,000,000

300,000,000

QC Blank DC 2h 4h 8h 12h

10,000,000

20,000,000

30,000,000

50,000,000

60,000,000

70,000,000

80,000,000

90,000,000

100,000,000

QC Blank DC 2h 4h 8h 12h

200,000,000

400,000,000

600,000,000

800,000,000

1,000,000,000

1,200,000,000

QCBlankDC2h4h8h12h

50,000,000

100,000,000

150,000,000

200,000,000

250,000,000

300,000,000

350,000,000

400,000,000

450,000,000

QCBlankDC2h4h8h12h

50,000,000

100,000,000

150,000,000

200,000,000

250,000,000

QCBlankDC2h4h8h12h

20,000,000

40,000,000

60,000,000

80,000,000

100,000,000

120,000,000

140,000,000

QCBlankDC2h4h8h12h

Methionine Proline

Linoleoyl-Lyso-PC (18:2)Arachidonic Acid

图 6. 禁食对代谢物变化影响的示例。混合血清 QC 重复样中所有代谢物都具有优异的重现性。因此不需要

技术性重复样。

图 7. 尽管实际 LC-MS 运行时,正离子和负离子两种模式运行时间相隔 30 小时,生物样品在两种

模式下测定的尿酸结果完全一致。

较小的技术性差异

负离子模式

正离子模式 分析时间相差30 小时

较大的生物差异