基于 Orbitrap GC-MS 的非靶向代謝組學(xué)
Stefan Weidt,2 Bogusia Pesko,2 Cristian Cojocariu,1 Paul Silcock,1 Richard J. Burchmore,2 and Karl Burgess2
1Thermo Fisher Scienti_c, Runcorn, UK
2Glasgow Polyomics, University of Glasgow, Glasgow, UK
關(guān)鍵詞
法醫(yī)學(xué);代謝組學(xué);多變量統(tǒng)計(jì)分析;Q Exactive GC 系統(tǒng)
引言
代謝組學(xué)旨在表征和定量生物系統(tǒng)中的完整小分子代謝通路或代謝物組。代謝物組包含小分子多元混合物(包括氨基酸、糖和磷酸糖、生物胺和脂質(zhì))。非靶向代謝組學(xué)極具挑戰(zhàn)性,因?yàn)槠湟蠖ㄐ院投可习賯(gè)不同種類化合物,而有關(guān)這些代謝物的經(jīng)驗(yàn)知識(shí)有限。因此,有必要使用一個(gè)既可以以非靶向的方式靈敏檢測(cè)特定分子,又可以提供精確質(zhì)量數(shù)信息,用于確認(rèn)未知物并對(duì)其進(jìn)行結(jié)構(gòu)解析的檢測(cè)系統(tǒng)。
氣相色譜質(zhì)譜聯(lián)用儀(GC-MS)基于其自身的優(yōu)點(diǎn)經(jīng)常用于代謝組學(xué)分析,尤其是其色譜分辨率、重現(xiàn)性、峰容量和便于使用的質(zhì)譜庫。GC為非靶向代謝組學(xué)中生物標(biāo)志物的發(fā)現(xiàn)提供了卓越的色譜分離能力,但是,由于目前缺乏高端質(zhì)譜儀的支持,從而限制了提供用于分析復(fù)雜樣品(例如,哺乳動(dòng)物的肌肉組織)的動(dòng)態(tài)范圍、精確質(zhì)量數(shù)和掃描速度。鑒于大部分重要代謝物的極性特征,必須將其衍生化,以使其有效揮發(fā),從而確保得到良好的色譜分離。代謝組學(xué)分析尤其是臨床代謝組學(xué)要求高通量和先進(jìn)的自動(dòng)化技術(shù)。
本項(xiàng)研究展示了新型 Thermo Scientific™ Orbitrap™ GC-MS 完整非靶向代謝組學(xué)工作流程,檢測(cè)了大鼠模型中的生物標(biāo)記物,以判定其死亡時(shí)間。死亡時(shí)間(PMI)推斷是法醫(yī)調(diào)查中一項(xiàng)最關(guān)鍵也是最困難的任務(wù),尤其當(dāng)尸體溫度與周圍環(huán)境溫度達(dá)到平衡后。由于當(dāng)前用于確定 PMI 的方法不精確性且以目視檢查尸體為主。因此,建立一種實(shí)驗(yàn)方法,使用耐用生物標(biāo)志物推斷死亡時(shí)間可輔助法醫(yī)調(diào)查。
該 GC-MS 裝置使用基于 Orbitrap 的檢測(cè)器,得到超高質(zhì)量數(shù)分辨率、亞 ppm 質(zhì)量數(shù)精度、寬動(dòng)態(tài)范圍以及一定的掃描速度,用于有效定量極復(fù)雜代謝組學(xué)樣品。高分辨率、穩(wěn)定的質(zhì)量數(shù)精度和快速的掃描速度是進(jìn)行穩(wěn)定的數(shù)據(jù)解卷積的關(guān)鍵因素,以檢測(cè)重疊 TIC 峰中的化合物,進(jìn)行非靶向代謝組學(xué)分析。電子轟擊電離(EI)裂解模式也適合基于應(yīng)用廣泛的 NIST 庫和 Wiley 庫進(jìn)行匹配,以識(shí)別化合物,同時(shí)為更深入的表征提供精確質(zhì)量數(shù)。
儀器和方法設(shè)置
樣品制備
從各個(gè)大鼠腿部肌肉組織切片取樣,以時(shí)間順序增加進(jìn)行尸檢及采樣。采用氯仿/甲醇/水(1:3:1)提取經(jīng)勻質(zhì)的組織切片中的代謝物,在冰塊下孵育 1 小時(shí)。蛋白質(zhì)和 DNA 進(jìn)行離心沉淀。去除上清液,貯藏在 -80 ℃ 條件下備用。
樣品衍生化
移取 200 μL 提取液至 1.5 mL 硼硅玻璃小瓶中,加蓋 9 mm 螺絲蓋。然后,將樣品置于 Thermo Scientific™ Reacti-Vap™ 蒸發(fā)器中,在 30 ℃ 條件下以低流速氮?dú)饬鞲稍?60 min。以下所有衍生化步驟均采用 Thermo Scientific™ TriPlus™ RSH 自動(dòng)樣品處理器進(jìn)行。
加入 20 μL 20 mg/mL(w/v)甲氧基胺鹽酸鹽的吡啶溶液至每個(gè)干燥小瓶中。將小瓶渦旋 10 秒并在 30 ℃ 條件下孵育 60 min。甲氧基化步驟完成以后,加入 30 μL MSTFA +1% TMCS(N-甲基-N-(三甲基硅基)三氟乙酰胺+1%三甲基氯硅烷)的混合液,進(jìn)一步渦旋 30 秒。將小瓶置于 45 ℃ 條件下孵育 60 min 進(jìn)行硅烷化。將樣品冷卻至室溫以備進(jìn)樣。
GC-MS 分析
所有實(shí)驗(yàn)均采用 Thermo Scientific™ Q Exactive™ GC 組合型四極桿 Orbitrap 質(zhì)譜儀進(jìn)行。采用 TriPlus RSH 自動(dòng)進(jìn)樣器進(jìn)樣,采用 Thermo Scientific™ TRACE™ 1310 GC 色譜儀和 Thermo Scientific™ TraceGOLD™ TG-5SilMS 15 m × 0.25 mm I.D. × 0.25 μm 薄膜毛細(xì)管柱(P/N: 26096-1301)進(jìn)行色譜分離。儀器參數(shù)的其他詳細(xì)信息見表 1 和表 2。
表 1. GC 溫度程序
TRACE 1310 GC 參數(shù) |
進(jìn)樣量(μL) |
1.0 |
襯管 |
單錐形(P/N 453A1345) |
入口(℃) |
250 |
入口模塊和模式 |
SSL,分流 1:60 |
載氣(mL/min) |
He,1.2 |
柱溫箱溫度程序 |
溫度 1(℃) |
70 |
保持時(shí)間(min) |
2 |
溫度 2(℃) |
325 |
速度(℃/min) |
10 |
保持時(shí)間(min) |
8.5 |
表 2. 質(zhì)譜儀參數(shù)
Q Exactive GC 質(zhì)譜儀參數(shù) |
傳輸線(℃) |
275 |
電離類型 |
EI |
離子源(℃) |
230 |
電離能量(eV) |
70 |
采集模式 |
全掃描 |
質(zhì)量數(shù)范圍(m/z) |
50–750 |
質(zhì)量數(shù)分辨率(m/z 200 時(shí)的 FWHM) |
60,000 |
質(zhì)量數(shù)內(nèi)標(biāo)的質(zhì)量數(shù)(m/z) |
207.03235 |
數(shù)據(jù)處理
數(shù)據(jù)分析流程首先使用 MSConvert(ProteoWizard 套件1的一部分)將原始數(shù)據(jù)文件轉(zhuǎn)換為 MzXML 文件。使用 XCMS 包2 和 centWave 算法提取峰。已檢測(cè)到的峰以 PeakML 格式輸出,然后使用 MzMatch.R 包對(duì)已檢測(cè)到的峰進(jìn)行后處理(過濾每組重復(fù)進(jìn)樣的最低檢測(cè)值、相對(duì)標(biāo)準(zhǔn)偏差和對(duì) EI 碎片組進(jìn)行分組的相關(guān)性匹配)。3生成的文本文件輸出使用 IDEOM 軟件4 進(jìn)行單變量統(tǒng)計(jì)處理,使用 SIMCA™ 13.0.35 進(jìn)行多變量統(tǒng)計(jì)處理。使用 Thermo Scientific 解卷積軟件進(jìn)行峰簇識(shí)別和解析。
結(jié)果和結(jié)論
將八只大鼠尸體置于室溫下四天。每日提取肌肉組織進(jìn)行分析,共檢測(cè) 16 個(gè)樣品中代謝物濃度的變化以分析尸體分解程度。對(duì)樣品進(jìn)行隨機(jī)分析以減小系統(tǒng)誤差。代謝組學(xué)優(yōu)化后的分析流程見圖 1。
圖 1. Q Exactive GC 系統(tǒng)代謝組學(xué)研究的工作流程。以不同顏色顯示工作流程包中的任務(wù)分工:綠色用于生物技術(shù)人員;橙色用于實(shí)驗(yàn)室技術(shù)人員;紫色用于儀器操作人員;藍(lán)色用于生物學(xué)信息處理人員。
圖 2. 大鼠肌肉組織樣品代謝 0–3 天后的 GC-MS 色譜圖(自上而下天數(shù)增加),X 軸為保留時(shí)間,Y 軸為強(qiáng)度(固定為1E9 計(jì)數(shù))。例如,記下高亮區(qū)域中峰強(qiáng)度隨時(shí)間的變化。
化合物發(fā)現(xiàn)階段
Q Exactive GC 系統(tǒng)獲取了每個(gè)樣品的全掃描色譜圖(圖 2)。該系統(tǒng)在較寬的動(dòng)態(tài)范圍內(nèi)采集不同濃度水平代謝物的全掃描色譜圖,不會(huì)丟失任何精確質(zhì)量數(shù)信息。使用自動(dòng)峰選。ńY(jié)合使用 XCMS 和 MzMatch.R)功能提取每個(gè) EI 峰簇。在該步驟中,已檢測(cè)到 1193 個(gè)明顯峰簇并進(jìn)行了初步定量,強(qiáng)度閾值為 100,000。已解卷積峰簇的示例見圖 3。
圖 3. 已解卷積峰簇被推斷識(shí)別為酪氨酸。
定量階段
首先使用單變量統(tǒng)計(jì)方法分析結(jié)果。使用 Student's t 檢驗(yàn)對(duì)比每個(gè)時(shí)間點(diǎn)和時(shí)間零點(diǎn)。將每個(gè)代謝物的平均 T0 強(qiáng)度設(shè)為 1,倍數(shù)變化顯示為 1 的倍數(shù)值,以方便對(duì)比強(qiáng)度明顯不同的代謝物(圖 4 和圖 5)。已檢測(cè)到 272 個(gè)代謝物的平均強(qiáng)度發(fā)生顯著性變化(P 值小于 0.05),包含已檢測(cè)峰簇的定量矩陣示例見表 3。
圖 4. 發(fā)生顯著性變化代謝物的火山圖。每個(gè)代謝物以深藍(lán)色菱形表示。強(qiáng)度比(X 軸)是指 T0/T3 時(shí)代謝物的倍數(shù)變化,Y 軸顯示代謝物的 P 值。因此,右上方和左上角的代謝物是倍數(shù)變化最大且最具有統(tǒng)計(jì)學(xué)意義的代謝物。
圖 5. 數(shù)據(jù)分析流程的總結(jié)。對(duì)原始數(shù)據(jù)進(jìn)行峰檢測(cè)和解卷積(a),然后將其以基峰的形式顯示在 IDEOM 代謝組學(xué)軟件中(b),含定量信息和定量統(tǒng)計(jì)方法。IDEOM 軟件也提供定量圖形信息(c),該圖顯示了每種條件下的平均強(qiáng)度和標(biāo)準(zhǔn)偏差,本例中每種條件下含四份相同的生物樣品。使用 NIST 庫歸屬目標(biāo)峰,(d)證實(shí)了質(zhì)譜數(shù)據(jù)的匹配的結(jié)果,圖下方含已歸屬衍生化氨基酸的Nist分?jǐn)?shù)值。
表 3. 已檢測(cè)峰簇的定量矩陣;澹ǚ宕刂袕(qiáng)度最大的峰)、保留時(shí)間(RT)和檢測(cè)到的最大強(qiáng)度見第 1–3 列。將 T0 的強(qiáng)度歸一化為 1,其他時(shí)間點(diǎn)的強(qiáng)度與 T0 強(qiáng)度相比并視情況以不同顏色顯示,見第 4–7 列。第 8–11 列包含每項(xiàng)比值的 T 檢驗(yàn) P 值。
使用 SIMCA 軟件進(jìn)行多變量統(tǒng)計(jì)分析。5將結(jié)論數(shù)據(jù)轉(zhuǎn)化為更為直觀的對(duì)數(shù)值,將 Y 類別設(shè)為各時(shí)間點(diǎn),生成數(shù)據(jù)的偏最小二乘判別分析(PLS-DA)模型。該軟件生成分?jǐn)?shù)圖和載荷圖,以顯示沿著主成分每個(gè)時(shí)間點(diǎn)的聚類和分離(圖 6)情況。從本次分析可知,死亡后立即取樣的樣品(RAT_T0)聚集在一起,與已分解的大鼠樣品(T1–T3)具有顯著性差異。從 T1–T3 樣品中可以觀察到分組聚類和持續(xù)分解。X 或 Y 軸上的位移表示某一代謝物對(duì)分?jǐn)?shù)圖中樣品群組之間分離的作用大小。在本例中,X 軸將 T0 與 T1–3 分開,Y 軸將 T1、T2 和 T3 分開(圖 6)。載荷圖上的每個(gè)藍(lán)點(diǎn)表示每個(gè)已檢測(cè)到的含 EI 碎片離子簇的代謝物(圖 7)。
圖 6. 分解數(shù)據(jù)的 PLS-DA 模型。該模型為有監(jiān)督多變量分析,將高維數(shù)據(jù)(例如,大量強(qiáng)度不同的代謝物)折疊為涵蓋數(shù)據(jù)集中主要變化的幾種主成分。在本例中,X 軸是主成分 1,Y 軸是主成分 2。注意,本項(xiàng)研究對(duì)樣品進(jìn)行了適當(dāng)聚類,每個(gè)群組聚集在一起,T0 已明顯與其他群組分開。
圖 7. PLS-DA 模型的載荷圖。根據(jù)代謝物(用藍(lán)色原點(diǎn)表示)對(duì)群組分離的作用大小對(duì)代謝物進(jìn)行聚類分析,見圖 6。例如,最右邊的代謝物對(duì)于定義 T0 樣品作用很大。
表 4. 分解期間含量不斷增加的代謝物的推定 ID 列表?梢酝ㄟ^精確質(zhì)量數(shù)和分子式推測(cè)進(jìn)行化合物確認(rèn)。只有在高分辨率和高質(zhì)量數(shù)精度條件下才能檢測(cè)到腐胺,并將其從背景離子中解卷積出來。
推測(cè)化合物 ID |
RT(min) |
NIST 正向匹配 |
與 T0 相比
的增加倍數(shù) |
基峰碎片
元素組成 |
ppm 精度
(基峰) |
ppm 精度
(分子離子) |
L 蘇氨酸,3TMS |
10.71 |
795 |
2.8 |
C9H24ONSi2 |
0.27 |
0.13 |
L 天冬氨酸,3TMS |
11.78 |
707 |
7.0 |
C9H22NO2Si2 |
0.18 |
0.34 |
L 甲硫氨酸,2TMS |
12.40 |
749 |
15.0 |
C7H18NSSi |
0.24 |
0.04 |
L 谷氨酰胺-3TMS |
15.32 |
815 |
2.0 |
C7H14NOSi |
0.53 |
0.21 |
腐胺,4TMS |
16.18 |
870 |
2.0 |
C7H20NSi2 |
0.05 |
N/A |
賴氨酸,4TMS |
16.88 |
732 |
5.1 |
C8H18NSi |
0.19 |
0.05 |
識(shí)別階段
依據(jù)現(xiàn)有商用庫(NIST)識(shí)別發(fā)生顯著性變化的代謝物,首先將其與氨基酸、與分解相關(guān)的化合物進(jìn)行匹配(表 4);诙嘧兞拷y(tǒng)計(jì)分析的整個(gè)流程總結(jié)見圖 5,圖中對(duì)峰進(jìn)行了解卷積、定量和識(shí)別。所有選擇的化合物得到的分?jǐn)?shù)均較高(> 700),使用精確質(zhì)量數(shù)進(jìn)行碎片匹配,從而進(jìn)一步提高了庫匹配結(jié)果的準(zhǔn)確度(表 3)。
結(jié)論
在此介紹的 Q Exactive GC 系統(tǒng)的工作流程順序?yàn)闃悠分苽、自?dòng)衍生化、GC 分離和質(zhì)譜檢測(cè)、數(shù)據(jù)分析和結(jié)果報(bào)告。這一工作流程使 Q Exactive GC 系統(tǒng)成為揮發(fā)性化合物和需衍生化非揮發(fā)性化合物進(jìn)行代謝組學(xué)分析的獨(dú)特分析工具。
卓越的色譜分離能力、可重現(xiàn)的色譜分離結(jié)合快速數(shù)據(jù)采集使 Q Exactive GC 系統(tǒng)成為復(fù)雜代謝組學(xué)分析的理想平臺(tái)。
超高分辨率、始終如一的亞 ppm 的精確質(zhì)量數(shù)測(cè)量為復(fù)雜生物分解基質(zhì)中存在的多種代謝物提供了可靠和高選擇性的分析。
較寬的動(dòng)態(tài)范圍為分析樣品中的代謝物提供高靈敏度和持續(xù)檢測(cè),且質(zhì)量數(shù)精度絲毫不受影響,同時(shí)為已檢測(cè)到的代謝物提供精確的相對(duì)定量。
可依據(jù)已有商用庫使用獲得的 EI 數(shù)據(jù)對(duì)化合物進(jìn)行初步識(shí)別,使研究人員對(duì)結(jié)果進(jìn)行評(píng)價(jià)。同時(shí),得到的精確質(zhì)量數(shù)允許對(duì)數(shù)據(jù)進(jìn)一步分析,如使用裂解分析(例如,Mass Frontier)或使AN 10457_C_GCMSMS_201508Y用標(biāo)準(zhǔn)品進(jìn)一步確認(rèn)目標(biāo)化合物。本例中,氨基酸信號(hào)的時(shí)間依賴性演變?yōu)闄z測(cè)死亡時(shí)間提供了一種簡(jiǎn)便的生化法醫(yī)分析檢測(cè)法。
致謝
感謝Mark McLaughlin 博士為我們提供了研究用大鼠。
參考文獻(xiàn)
1. ProteoWizard Page. http://proteowizard.sourceforge.net/
(accessed Apr. 22, 2015).
2. C.A. Smith, E.J. Want, G.C. Tong, R. Abagyan, and G. Siuzdak. XCMS: Processing Mass Spectrometry Data for Metabolite Profiling Using Nonlinear Peak Alignment, Matching, and Identification. Anal. Chem.
2006, 78 (3), 779–787.
3. Richard A. Scheltema, Andris Jankevics, Ritsert C. Jansen, Morris A. Swertz, and Rainer Breitling. PeakML/mzMatch: A File Format, Java Library, R Library, and Tool-Chain for Mass Spectrometry Data Analysis. Anal. Chem.
2011 83 (7), 2786–2793.
4. Creek, D.J., Jankevics, A., Burgess, K.E.V., Breitling, R., and Barrett, M.P. IDEOM: an excel interface for analysis of LC-MS based metabolomics data. Bioinformatics.
2012. 28 (7), 1048–1049.
5. SIMCA Page, Umetrics Website. http://www.umetrics. com/products/simca
(accessed Apr. 22, 2015).
Orbitrap組學(xué)俱樂部 賽默飛小分子質(zhì)譜應(yīng)用技術(shù)群
賽默飛世爾科技(中國(guó))有限公司
全國(guó)服務(wù)熱線:
800 810 5118
400 650 5118(支持手機(jī)用戶)