Fig.1樣品制備和數(shù)據(jù)采集
為了提高吞吐量,作者開(kāi)發(fā)了一種新的樣品制備方案,該方案由幾個(gè)手動(dòng)步驟組成,便于放大(圖1)。作者比較了幾種不同的提取緩沖液成分,最后選擇了鹽酸和非離子洗滌劑NP-40的混合物,將脫鹽和蛋白質(zhì)提取結(jié)合起來(lái)。蛋白質(zhì)是通過(guò)同時(shí)脫礦和萃取從骨屑或骨粉中獲得的,蛋白質(zhì)聚集清除磁性小球處理機(jī)器人可以自動(dòng)捕獲和消化。肽通過(guò)串聯(lián)質(zhì)譜快速分離和分析,每天的吞吐量為100個(gè)樣本(DDA)或每天200個(gè)樣本(DIA)。
2. 肽快速識(shí)別
Fig.2比較通過(guò)常規(guī)數(shù)據(jù)庫(kù)搜索分析的快速100 spd DDA方法和通過(guò)基于庫(kù)與無(wú)庫(kù)方法分析的快速200 spd DIA方法在保留時(shí)間內(nèi)累積的前體識(shí)別。
SPIN使用非常短的在線LC梯度來(lái)加速納米流色譜與Orbitrap串聯(lián)質(zhì)譜聯(lián)用。與診斷血漿蛋白質(zhì)組學(xué)中最快的采集方法(每天測(cè)量約50個(gè)樣本)或傳統(tǒng)蛋白質(zhì)組學(xué)中每天不到10個(gè)樣本的常用方法相比,我們通過(guò)數(shù)據(jù)獨(dú)立采集(DIA)和數(shù)據(jù)依賴采集(DDA)實(shí)現(xiàn)了足夠的蛋白質(zhì)組覆蓋率,每天可識(shí)別多達(dá)200個(gè)樣本和100個(gè)樣本。在現(xiàn)代牛骨樣本中,快速掃描DDA在11分鐘內(nèi)識(shí)別出約1200個(gè)前體,而當(dāng)direct DIA在沒(méi)有光譜庫(kù)的情況下進(jìn)行分析時(shí),DIA在5.6分鐘內(nèi)達(dá)到相同的識(shí)別數(shù)量(圖2c)。通過(guò)對(duì)高pH值反相色譜離線分離的多肽進(jìn)行DDA分析,每個(gè)物種需要一次性生成一個(gè)專用的光譜庫(kù),而DIA分析鑒定出的前體數(shù)量幾乎是后者的兩倍然而,DIA產(chǎn)生了更多的冗余和重疊前體,因此沒(méi)有產(chǎn)生兩倍的絕對(duì)序列覆蓋(圖2d)。在40個(gè)現(xiàn)代參考樣本中,DDA方法的平均覆蓋率為3678個(gè)氨基酸,因此優(yōu)于無(wú)庫(kù)directDIA方法的3226個(gè)氨基酸。以文庫(kù)為基礎(chǔ)的DIA的平均覆蓋率最高,為4480個(gè)氨基酸。
3. 用已知物種的骨骼驗(yàn)證SPIN
Fig. 3 參考物種分析
作者利用一組來(lái)自13個(gè)物種的49塊已知參考骨對(duì)不同數(shù)據(jù)采集和解釋策略的性能進(jìn)行了優(yōu)化和評(píng)估(圖3a)。使用基于庫(kù)的DIA將所有樣本放入正確的屬中,而無(wú)庫(kù)的directDIA不能排除黑猩猩是人類,而DDA不能排除8只綿羊樣本中的一只是山羊。當(dāng)涉及到科內(nèi)分類單元的位置時(shí),這三種方法都表現(xiàn)得同樣好。在牛的內(nèi)部,家養(yǎng)牛(牛牛)可以區(qū)別于歐洲野牛(野牛bonasus),但不能區(qū)別于原牛(Bos primigenius)。歐洲野牛本身無(wú)法與美洲野牛和牦牛區(qū)別開(kāi)來(lái),在一個(gè)案例中,還與瘤牛區(qū)別開(kāi)來(lái)。在馬類中,馴養(yǎng)的馬(馬科動(dòng)物caballus)成功地與驢子(馬科動(dòng)物africanus asinus)區(qū)分開(kāi)來(lái),這是PMF無(wú)法做到的,但與蒙古野馬(馬科動(dòng)物przewalskii)區(qū)分不出來(lái)。因此,SPIN在技術(shù)上能夠進(jìn)行混合檢測(cè),但需要對(duì)其可靠性進(jìn)行評(píng)估。
4. 性能和再現(xiàn)性基準(zhǔn)
Fig. 4 斯堪的納維亞鐵器時(shí)代骨骼的物種鑒定
作者利用文庫(kù)DIA和精細(xì)分組的SPIN分析得到了49個(gè)準(zhǔn)確的物種鑒定和3個(gè)近似的物種鑒定,而11個(gè)樣品由于肽強(qiáng)度低而被排除(圖4B)。副本分析的比較顯示,站點(diǎn)覆蓋范圍為3000個(gè)氨基酸的副本之間具有完美的重現(xiàn)性(圖4c)。在兩個(gè)重復(fù)的99個(gè)樣品中,96個(gè)樣品的文庫(kù)DIA的SPIN分析與形態(tài)學(xué)分析一致。作者比較了library DIA、directDIA和DDA三種不同類型肽的鑒定性能,它們對(duì)參考樣品的鑒定效果非常相似。在Salpetermosen樣本集中,差異變得更加明顯。偽roc曲線分析表明,基于dia的方法優(yōu)于DDA,特別是在低重復(fù)量的情況下,表明基于dia的測(cè)量具有更高的靈敏度(圖4d)。在兩種DIA方法之間,基于庫(kù)的DIA比directDIA一致產(chǎn)生更多的真實(shí)物種識(shí)別。
研究結(jié)論:
作者提出了一種新的遺傳物種鑒定工作流程,該流程可以彌補(bǔ)高通量靶向方法(如PMF、PCR或ELISA)和更強(qiáng)大的低通量方法(如NGS或傳統(tǒng)的LC-MS/MS蛋白質(zhì)組學(xué)分析)之間的差距。我們證明,基于PAC的自動(dòng)化樣品制備工作流可通過(guò)LC-MS/MS產(chǎn)生用于骨蛋白質(zhì)組分析的高質(zhì)量肽樣品,并允許輕松放大。在速度和成本方面,數(shù)據(jù)采集曾經(jīng)是一個(gè)瓶頸,但現(xiàn)在卻大大縮短了,每臺(tái)MS儀器每天最多可以采集200個(gè)樣品。用于SPIN的數(shù)據(jù)解釋策略有助于對(duì)目前多達(dá)156種物種進(jìn)行無(wú)偏比較,并由于FDR在肽和物種識(shí)別水平上的控制,提供了較高的可信度;趯(duì)丹麥64塊部分降解骨骼的分析,我們得出結(jié)論,基于庫(kù)的DIA方法可以實(shí)現(xiàn)最高的置信度和靈敏度。
到目前為止,SPIN數(shù)據(jù)分析僅限于156個(gè)改進(jìn)文庫(kù)- dia分析的13個(gè)光譜文庫(kù)。我們?cè)O(shè)想,隨著更多的研究小組共享他們的蛋白質(zhì)序列數(shù)據(jù)庫(kù)和光譜庫(kù),這些數(shù)字將會(huì)增長(zhǎng)。此外,隨著時(shí)間的推移,SPIN工作流本身很可能會(huì)得到改進(jìn)和擴(kuò)展。我們認(rèn)為這是一個(gè)模塊化的協(xié)議,它可以作為“分拆”的基礎(chǔ)與自定義構(gòu)建塊方法,如:(i)樣品制備改性支持從深加工的食品中提取蛋白質(zhì),(2)數(shù)據(jù)采集用于不同的樂(lè)器,或(3)數(shù)據(jù)解釋包括性識(shí)別。我們已經(jīng)接觸了SPIN的更高級(jí)的用例,比如雜交物種的識(shí)別,比如騾子。此外,它可以適應(yīng),從多個(gè)分類群溶解蛋白質(zhì)混合物或量化蛋白質(zhì)損傷,在未來(lái)。最后,由于每個(gè)樣品的分析成本的降低和高度的自動(dòng)化程度,我們預(yù)計(jì)SPIN工作流程將使LCMS/MS對(duì)每個(gè)人更容易訪問(wèn)。
參考文獻(xiàn):
Rüther, P. L., Husic, I. M., Bangsgaard, P., Gregersen, K. M., Pantmann, P., Carvalho, M., ... & Olsen, J. V. (2021). SPIN-Species by Proteome INvestigation. BioRxiv.