圖1. (a) SWATHtoMRM 技術(shù)流程概覽。 (b) 從SWATH數(shù)據(jù)中提取虛擬MS²圖譜。 (c) 將來自多個(gè)樣品的MS²譜圖合并為consensus 譜圖,保留出現(xiàn)頻率超過50%的碎片離子,并用于生成MRM離子對(duì)。
1.非靶向分析SWATH數(shù)據(jù)
a) 使用XCMS包中的CentWave算法實(shí)現(xiàn)色譜峰(LC peak)識(shí)別,然后用CAMERA進(jìn)行質(zhì)譜峰(MS peak)注釋,并去除同位素峰和小于1000的弱信號(hào)峰。對(duì)于多個(gè)數(shù)據(jù)文件,使用OBI-Warp算法進(jìn)行峰對(duì)齊。→MS¹ LC peak 。
b) 針對(duì)每一個(gè)MS¹peak,從峰頂位置找到對(duì)應(yīng)RT的混合MS²譜圖,并過濾掉小于200的弱信號(hào)值、同位素離子以及大于母離子m/z的碎片離子。提取保留的碎片離子色譜峰(EIC)。→MS² LC peak 。
c) 通過計(jì)算每一個(gè)碎片離子EIC與母離子EIC之間的相關(guān)性得分(PPC score),將得分大于0.8的碎片離子EIC和對(duì)應(yīng)母離子EIC歸為一組,得到peak group(一個(gè)母離子EIC +多個(gè)碎片離子EIC),然后對(duì)每個(gè)peak group生成一張?zhí)摂M二級(jí)譜圖。→ Pseudo MS² spectrum。
d) 將來自多個(gè)樣品的相同MS¹ peak的二級(jí)譜圖合并為一張譜圖(consensus MS²)。合并原則為:保留出現(xiàn)頻率超過50%的碎片離子,合并后的m/z為mean(m/z),intensity %為 mean(intensity %)。→ Consensus MS² spectrum。
2.生成MRM離子對(duì)信息
a) 采用3個(gè)原則評(píng)估consensus MS²中每一個(gè)碎片離子:(1)m/z(product ion)使用Agilent MassHunter構(gòu)建schedule MRM方法,最小dwell 時(shí)間 5ms,cycle time為990ms。
代謝組學(xué)文獻(xiàn)分享—結(jié)果與討論
SWATHtoMRM 流程評(píng)估
首先,作者測(cè)試了SWATHtoMRM技術(shù)在多種生物樣品,例如,人類尿液、結(jié)腸直腸組織以及Jurkat細(xì)胞中的適用性。
以人尿液樣品為例,3554個(gè)MS¹ feature在SWATH數(shù)據(jù)中被檢測(cè)到,其中950個(gè)同位素峰和弱信號(hào)峰被初步過濾。剩余的2604個(gè)代謝物峰中,2091 (80.3%) 個(gè)代謝物具有合適的MRM離子對(duì)信息,其他代謝物峰由于不滿足PPC > 0.8這一條件被進(jìn)一步剔除。通過手動(dòng)分析2091個(gè)MRM離子對(duì)結(jié)果發(fā)現(xiàn),多達(dá)1614 (77.2%) 個(gè)代謝物成功在尿液樣品中檢測(cè)到(圖2a)。
類似的,在其他類型樣品中得到了接近的檢出率(76 - 80%)。 本次實(shí)驗(yàn)中僅采用了正離子模式,但負(fù)離子模式也是完全適用的。
圖2b詳細(xì)演示了通過SWATHtoMRM構(gòu)建MRM離子對(duì)的過程。 以taurine這個(gè)代謝物(m/z = 126.0212 Da,RT= 518 s)為例:首先,包含多個(gè)代謝物碎片離子的多重二級(jí)譜圖被提取出來。然后根據(jù)與母離子EIC之間的相關(guān)性PPC,保留得分大于0.8 的碎片離子。隨后,將來自多個(gè)樣品的同一代謝物二級(jí)譜圖合并,得到一張包含13個(gè)碎片離子的consensus二級(jí)譜圖。最后,從中選擇響應(yīng)強(qiáng)度最高的碎片離子(m/z = 44.0496 Da)構(gòu)建taurine的MRM離子對(duì)(Q1/Q3, 126.0/44.0)。
圖2. (a) 使用人尿液樣品大規(guī)模生成MRM離子對(duì)。(b) 代謝物taurine的離子對(duì)生成過程。 (c) 從不同類型生物樣品(尿液,組織和細(xì)胞)中檢測(cè)到的MRM離子對(duì)統(tǒng)計(jì)信息。
SWATHtoMRM技術(shù)的覆蓋度評(píng)估
為了證實(shí)這一技術(shù)具有廣泛的覆蓋度,作者將SWATHtoMRM方法與DDA方法做了系統(tǒng)的比較。使用相同的尿液樣品,相同的儀器參數(shù),連續(xù)采集SWATH和DDA數(shù)據(jù)。后續(xù)的數(shù)據(jù)分析也采用相似的參數(shù)自動(dòng)化進(jìn)行,以較大的降低主觀偏好性。從相同的尿液樣品中,分別檢測(cè)出2604(SWATH)和2149(DDA)個(gè)feature(圖3a, 3b)。比較兩者的二級(jí)譜圖覆蓋度,SWATH(2105, 80.8%)顯著高于DDA(1174, 54.6%)。二級(jí)覆蓋度在兩者共享feature中,SWATH(84.9%)也顯著高于DDA(61.1%)。
SWATH與DDA技術(shù)分別成功構(gòu)建2091和1163個(gè)MRM離子對(duì),其中852個(gè)是共享離子對(duì)(圖3c)。在這852個(gè)共享離子對(duì)中,分別有87.2%(SWATH)和88.7%(DDA)的檢出率,兩種方法具有接近的檢出率,說明SWATH技術(shù)生成的MRM離子對(duì)信息是可靠的(圖3d)。 但是從總檢出數(shù)上來看,SWATH技術(shù)比DDA多出66%的代謝物。簡(jiǎn)言之,SWATH技術(shù)具有與DDA相似的數(shù)據(jù)質(zhì)量,同時(shí)又顯著超越了DDA的檢測(cè)數(shù)量。
圖3. 從SWATH數(shù)據(jù)中生成的MRM離子對(duì)具有很廣的覆蓋度。(a) 韋恩圖展示了SWATH與DDA技術(shù)檢測(cè)到的共享和特有feature。(b) SWATH與DDA數(shù)據(jù)中MS¹和MS²的分布圖。紅/藍(lán)=有MS²,灰色=無MS²。(c) 兩種方法構(gòu)建的MRM離子對(duì)數(shù)目比較。(d) 兩種方法檢測(cè)到的代謝物數(shù)目比較。
SWATHtoMRM定量性能評(píng)估
為了評(píng)估SWATHtoMRM技術(shù)的定量性能,作者對(duì)比了SWATHtoMRM,SWATH-MS¹以及SWATH-MS² 3種技術(shù)間的靈敏度、動(dòng)態(tài)范圍和重復(fù)性。首先,梯度稀釋尿液樣品,分別進(jìn)行SWATHtoMRM和SWATH采集,然后隨機(jī)選擇629個(gè)檢測(cè)到的代謝物進(jìn)行比較。
1.靈敏度:比較不同稀釋梯度中代謝物檢出數(shù)來評(píng)估,結(jié)果SWATHtoMRM > SWATH-MS¹= SWATH-MS²(圖4a)。將這一比較細(xì)化到不同豐度范圍代謝物中,同樣是SWATHtoMRM優(yōu)勝,尤其是在低豐度代謝物中(圖4b)。
2.動(dòng)態(tài)范圍:比較不同稀釋梯度中,629個(gè)代謝物的定量線性范圍(R²)來評(píng)估,結(jié)果SWATHtoMRM > SWATH-MS¹> SWATH-MS²,SWATHtoMRM數(shù)據(jù)中R²> 0.8的代謝物超過了80%,而SWATH-MS¹和SWATH-MS²則不到60%(圖4c)。
3.重復(fù)性:通過比較相鄰稀釋梯度的代謝物檢出強(qiáng)度比值來評(píng)估。統(tǒng)計(jì)629個(gè)代謝物在兩組相鄰稀釋梯度間檢出強(qiáng)度比值(4×:16×、16×:64×,log2(理論值)=2),結(jié)果表明SWATHtoMRM > SWATH-MS¹> SWATH-MS²,SWATHtoMRM技術(shù)在不同的稀釋梯度組合中具有接近的中位值以及較窄的分布,同時(shí)SWATH-MS¹也是優(yōu)于SWATH-MS²的,SWATH-MS²在16×:64×組合中,比值中位數(shù)已經(jīng)嚴(yán)重偏離了理論值(4倍),并且具有很寬的分布范圍(圖4e)。
圖4. SWATHtoMRM技術(shù)定量性能評(píng)估。(a) 3種方法在不同稀釋梯度中的代謝物檢出數(shù)比較。 (b) 細(xì)化到不同豐度范圍時(shí)代謝物檢出數(shù)。(c)R²累積分布,從R²=1到R²=0.8,滿足條件的代謝物數(shù)目逐漸增多。(d) 列舉了兩種實(shí)際代謝物的定量線性范圍。(e) 兩個(gè)相鄰稀釋梯度間的比值分布圖。
SWATHtoMRM實(shí)用性評(píng)估
為了評(píng)估SWATHtoMRM技術(shù)的實(shí)用性能,作者將該技術(shù)運(yùn)用于結(jié)腸癌(CRC)診斷標(biāo)志物的發(fā)現(xiàn)研究(18對(duì)樣品作為訓(xùn)練集,42對(duì)用作驗(yàn)證集)。利用pooled QC樣品構(gòu)建了1705個(gè)MRM離子對(duì),并成功檢測(cè)到了其中的1303(76.4%)個(gè)代謝物?偣灿1213(93.1%)個(gè)代謝物在>4個(gè)實(shí)際組織樣品中加測(cè)到,并用于后續(xù)統(tǒng)計(jì)分析。從QC樣品的RSD以及PCA分析結(jié)果來看,SWATHtoMRM在重復(fù)性和靈敏度方面顯著優(yōu)于SWATH-MS¹技術(shù),主要表現(xiàn)在更低中位RSD值和較窄的RSD分布(圖5a),以及PCA得分圖中更小的組內(nèi)離散度和更大的組間分離度(圖5b)。
在生物標(biāo)志物發(fā)現(xiàn)研究階段,1303個(gè)代謝物中有358個(gè)具有統(tǒng)計(jì)學(xué)差異(fold-change >1.5, p-value > 0.01),其中67個(gè)被成功鑒定。隨后,使用PLS-DA模型分析了CRC癌組織與癌旁組織的代謝物差異,VIP最高的20個(gè)代謝物被定義為潛在生物標(biāo)志物(圖5d),并具有極好的辨別能力(AUC = 1)。接下來,作者在驗(yàn)證集樣品中檢測(cè)了這20個(gè)代謝物,并評(píng)估了其預(yù)測(cè)精度,結(jié)果發(fā)現(xiàn)這些代謝物在驗(yàn)證集樣品中同樣具有極好的辨別能力(AUC=0.998,95% CI)(圖5e)。
最后,作者使用CRC病人手術(shù)切除前后血漿樣品來評(píng)估了這些代謝物的預(yù)后標(biāo)志物潛力。其中17個(gè)代謝物表現(xiàn)出可靠的預(yù)測(cè)能力(AUC = 0.779,95% CI,sensitivity = 91.2%,specificity = 64.7%)(圖5f)。
圖5. (a) QC樣品中檢測(cè)到的1213個(gè)代謝物RSD值分布。(b) 分別使用SWATH-MS¹和SWATHtoMRM技術(shù)檢測(cè)癌組織和癌旁組織中代謝物得到的PCA打分。(c)生物標(biāo)志物發(fā)現(xiàn)研究的SWATHtoMRM實(shí)驗(yàn)流程。(d) 火山圖展示1213個(gè)檢測(cè)到的代謝物,紅色點(diǎn)表示定義的20個(gè)潛在生物標(biāo)志物。(e) 使用驗(yàn)證集組織樣品的20個(gè)代謝物構(gòu)建的PLS預(yù)測(cè)模型ROC曲線(左)和概率分布圖(右)。(f) 使用驗(yàn)證集血漿樣品的17個(gè)代謝物構(gòu)建的PLS預(yù)測(cè)模型ROC曲線(左)和概率分布圖(右)。
代謝組學(xué)文獻(xiàn)分享—總結(jié)
作者開發(fā)了一種新的靶向代謝組學(xué)技術(shù)—SWATHtoMRM,可同時(shí)檢測(cè)高達(dá)1000-2000個(gè)代謝物。并從多個(gè)角度詳細(xì)對(duì)比了SWATHtoMRM與DDA、SWATH-MS¹以及SWATH-MS²技術(shù)之間的優(yōu)劣。與DDA相比,SWATHtoMRM技術(shù)能夠構(gòu)建更多的MRM離子對(duì)。而與SWATH-MS技術(shù)相比,SWATHtoMRM具有更好的重復(fù)性、更高的靈敏度和更廣的覆蓋度。同時(shí)通過實(shí)際案例探究了該方法在代謝物生物標(biāo)志物發(fā)現(xiàn)研究中的巨大潛力。