蛋白質(zhì)組學(xué)基礎(chǔ):快速理解DDA與DIA的方法
瀏覽次數(shù):1501 發(fā)布日期:2024-8-22
來(lái)源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
基于質(zhì)譜(MS)的蛋白質(zhì)組學(xué)實(shí)現(xiàn)了生物樣本中蛋白質(zhì)表達(dá)譜的定性定量分析,并且可以輔助研究各種不同狀態(tài)下蛋白的相互作用。典型的自下而上的蛋白質(zhì)組學(xué)工作流程(圖1)包括幾個(gè)主要步驟:(i) 從所研究的生物樣品中提取蛋白質(zhì)混合物,(ii) 對(duì)分離的蛋白質(zhì)濃度進(jìn)行測(cè)定,(iii) 通過(guò)凝膠電泳或液相色譜法對(duì)蛋白質(zhì)進(jìn)行分離(可選),(iv) 蛋白質(zhì)酶切, (v) 質(zhì)譜檢測(cè),(vi) 數(shù)據(jù)庫(kù)搜索蛋白質(zhì)鑒定。
圖1 自下而上的蛋白質(zhì)組學(xué)流程[1]
近年來(lái),許多質(zhì)譜方法從數(shù)據(jù)依賴采集(DDA)過(guò)渡到數(shù)據(jù)非依賴采集(DIA)。雖然DIA靈敏度和覆蓋度高,但并不是所有的研究都適合,很多情況下DDA反而更合適。對(duì)于很多初涉質(zhì)譜蛋白質(zhì)組學(xué)領(lǐng)域的研究者來(lái)說(shuō),往往對(duì)DDA和DIA的方法難以理解,因此,本期推送我們給大家詳細(xì)介紹一下這兩種不同的質(zhì)譜采集方法。
首先,我們要對(duì)質(zhì)譜采集信號(hào)的過(guò)程有個(gè)簡(jiǎn)單的概念。簡(jiǎn)言之,我們的肽段在經(jīng)過(guò)液相(LC)洗脫之后,被電離霧化成為帶電離子(即母離子,precursor)進(jìn)入質(zhì)譜內(nèi)部,首先經(jīng)過(guò)一級(jí)母離子的全掃描(即survey scan),得到MS1譜圖,然后針對(duì)這些掃描到的母離子,選擇哪些離子去做下一步的MS2碎裂和掃描,就涉及了DDA還是DIA的問題。
DDA
DDA是Data Dependent Acquisition的縮寫,即數(shù)據(jù)依賴采集,指的是在一個(gè)循環(huán)內(nèi),選取離子強(qiáng)度Top N的MS1母離子進(jìn)行MS2碎裂與掃描(原理示意見圖2),N在質(zhì)譜采集方法中進(jìn)行設(shè)定,一般為10-20。隨著肽段流出,完成整個(gè)液相梯度內(nèi)的譜圖采集,產(chǎn)生的下機(jī)數(shù)據(jù)隨后采用相應(yīng)的軟件完成肽段和蛋白的鑒定和定量。
圖2 DDA譜圖采集示意圖
DDA是質(zhì)譜采集方法的一種大類,與不同的實(shí)驗(yàn)方法結(jié)合,又可以產(chǎn)生不同的數(shù)據(jù)類型,滿足不同的實(shí)驗(yàn)需求,包括常規(guī)的定性、非標(biāo)記定量(LFQ)、標(biāo)記定量(TMT/SILAC等)。
DDA的優(yōu)勢(shì)在于實(shí)驗(yàn)方法簡(jiǎn)單,其譜圖的復(fù)雜性較低,不僅可以進(jìn)行標(biāo)準(zhǔn)的搜庫(kù)分析,還可以進(jìn)行l(wèi)arge search space搜索,如PTM search、酶切半特異性及非特異性搜索,甚至開放搜索。針對(duì)未知樣本,則需要進(jìn)行從頭測(cè)序(de novo)分析。DDA的局限性在于檢測(cè)動(dòng)態(tài)范圍有限,易損失低豐度的離子,從而產(chǎn)生較多的定量缺失值,導(dǎo)致重現(xiàn)性不穩(wěn)定,對(duì)于復(fù)雜樣本的全蛋白組鑒定深度不夠。
針對(duì)DDA數(shù)據(jù),PEAKS®軟件既可以針對(duì)未知樣本單獨(dú)進(jìn)行從頭測(cè)序分析,也可以進(jìn)行de novo輔助的搜庫(kù)分析(DB search),以及非標(biāo)記定量和各種標(biāo)記定量分析。此外,PEAKS®還整合了獨(dú)有的免疫肽組分析、未知翻譯后修飾及突變位點(diǎn)檢索、完整糖肽鑒定(Studio Only)(圖3),滿足絕大部分DDA數(shù)據(jù)的定性、定量分析需求。
圖3 PEAKS®軟件DDA分析工作流
DIA
DIA的全稱是Data Independent Acquisition,即數(shù)據(jù)非依賴采集,另一種說(shuō)法為sequential window Acquisition of All Theoretical Fragment ions(SWATH),簡(jiǎn)單理解就是二級(jí)的采集不依賴一級(jí)信號(hào)離子的選擇,而是把MS1所有掃描到的母離子按照m/z劃分為若干個(gè)小的窗口,對(duì)每個(gè)窗口內(nèi)的所有母離子進(jìn)行二級(jí)碎裂和掃描,可以認(rèn)為是無(wú)差別“攻擊”(原理示意見圖4)。
圖4 DIA譜圖采集示意圖
DIA的譜圖復(fù)雜度要遠(yuǎn)遠(yuǎn)高于DDA,因此在DIA方法開發(fā)的初期,數(shù)據(jù)分析基本上依賴于譜圖庫(kù)搜索(Spectral library)的方法,即要事先通過(guò)多組份分餾的方法將所有待分析樣本的混合物進(jìn)行高pH液相色譜分離,然后通過(guò)DDA的采集方法獲得建庫(kù)數(shù)據(jù),使用建庫(kù)數(shù)據(jù)的鑒定結(jié)果作為譜圖庫(kù),然后進(jìn)行DIA數(shù)據(jù)的定性和定量分析。譜圖庫(kù)搜索速度快、準(zhǔn)確性高,但也存在一些局限,比如建庫(kù)深度不夠,建庫(kù)需要額外的樣品消耗、成本和機(jī)時(shí)等。隨著譜圖解析算法的發(fā)展,針對(duì)DIA的數(shù)據(jù)使用理論參考序列庫(kù)進(jìn)行直接解譜已經(jīng)得到了廣泛應(yīng)用,深度學(xué)習(xí)模型的引入,大大提高了DIA直接數(shù)據(jù)庫(kù)搜索的譜圖解析率和準(zhǔn)確性,也使得DIA de novo分析成為可能[2]。
DIA的優(yōu)勢(shì)在于對(duì)樣本中所有多肽的無(wú)偏檢測(cè),檢測(cè)動(dòng)態(tài)范圍廣,突破了DDA對(duì)低豐度樣本檢測(cè)的局限,非常適合大規(guī)模、微量樣本的蛋白質(zhì)組學(xué)研究。但DIA對(duì)質(zhì)譜硬件和軟件的要求比DDA更高,綜合成本相應(yīng)就有所增加,此外存在很多翻譯后修飾,也會(huì)導(dǎo)致譜圖更加復(fù)雜。
PEAKS®軟件支持DIA數(shù)據(jù)的譜圖庫(kù)搜索(Spectral Library search)、直接數(shù)據(jù)庫(kù)搜索(direct DB search)、DIA數(shù)據(jù)的從頭測(cè)序(DIA de novo)分析之外,還獨(dú)有DIA免疫肽組的定性定量分析功能,也支持hybrid-DIA數(shù)據(jù)分析(圖5)。
圖5 PEAKS®軟件DIA數(shù)據(jù)分析工作流
DDA or DIA, that is the question.
作為質(zhì)譜蛋白質(zhì)組學(xué)研究的兩大類方法,DDA和DIA各有優(yōu)缺點(diǎn),并沒有絕對(duì)的好壞之分,適合的才是最好的。DIA更加適合進(jìn)行需要高覆蓋率和定量準(zhǔn)確性的大規(guī)模蛋白質(zhì)組學(xué)研究。Rebecca C. Poulos等 (2020) [3]將卵巢癌組織、前列腺癌組織和酵母蛋白按照不同比例混合,以HEK293T細(xì)胞蛋白作為對(duì)照,歷時(shí)4個(gè)月,在6臺(tái)質(zhì)譜儀上共采集了1560針DIA數(shù)據(jù),期間還穿插了5000多針其他樣品的數(shù)據(jù)采集。數(shù)據(jù)分析結(jié)果顯示,在短時(shí)間內(nèi)獲得的DIA-MS數(shù)據(jù)重現(xiàn)性和定量準(zhǔn)確性均較高,但隨著采集間隔時(shí)間的延長(zhǎng)和儀器性能的變化,CV值會(huì)累積增加,因此對(duì)于大隊(duì)列、長(zhǎng)時(shí)間的數(shù)據(jù)采集,仍需要開發(fā)合適的歸一化校正方法。
(Rebecca C. Poulos等,2020)
DDA 更加適合需要高靈敏度和準(zhǔn)確性的小規(guī)模研究,尤其是對(duì)于純化蛋白、翻譯后修飾組學(xué)的研究。此外,DDA可搭配各種不同的標(biāo)記實(shí)驗(yàn)方法,提升定量的穩(wěn)定性。Matthias Mann等 (2023)[4]使用DDA 分析了小鼠心臟、骨骼肌等7種組織線粒體的全蛋白組和磷酸化蛋白組,共鑒定到1266個(gè)線粒體蛋白,超過(guò)MitoCarta 3.0數(shù)據(jù)庫(kù)中的92%,且定量CV小于20%。線粒體磷酸化蛋白質(zhì)組表現(xiàn)出廣泛的線粒體內(nèi)磷酸化,且與融合和裂變的組織特異性調(diào)節(jié)有關(guān)。該研究是 DDA 對(duì)細(xì)胞器蛋白質(zhì)組及磷酸化修飾高靈敏鑒定的典型示例。
(Matthias Mann等,2023)
劃重點(diǎn)
- Dupree, E.J.; Jayathirtha, M.; Yorkey, H.; Mihasan, M.; Petre, B.A.; Darie, C.C. A Critical Review of Bottom-Up Proteomics: The Good, the Bad, and the Future of This Field. Proteomes 2020, 8, 14. https://doi.org/10.3390/proteomes8030014
- Tran, N.H., Qiao, R., Xin, L. et al. Deep learning enables de novo peptide sequencing from data-independent-acquisition mass spectrometry. Nat Methods 16, 63–66 (2019). https://doi.org/10.1038/s41592-018-0260-3
- Poulos, R.C., Hains, P.G., Shah, R. et al. Strategies to enable large-scale proteomics for reproducible research. Nat Commun 11, 3793 (2020). https://doi.org/10.1038/s41467-020-17641-3
- Hansen, F. M., Kremer, L. S., Karayel, O., Bludau, I., Larsson, N.-G., Kühl, I., & Mann, M. (2024). Mitochondrial phosphoproteomes are functionally specialized across tissues. Life Science Alliance, 7(2), e202302147. doi:10.26508/lsa.202302147
-掃碼關(guān)注-
www.bioinfor.com (EN)
www.deepproteomics.cn(CN)
作為生物信息學(xué)的領(lǐng)軍企業(yè),BSI專注于蛋白質(zhì)組學(xué)和生物藥領(lǐng)域,通過(guò)機(jī)器學(xué)習(xí)和先進(jìn)算法提供世界領(lǐng)先的質(zhì)譜數(shù)據(jù)分析軟件和蛋白質(zhì)組學(xué)服務(wù)解決方案,以推進(jìn)生物學(xué)研究和藥物發(fā)現(xiàn)。我們通過(guò)基于AI的計(jì)算方案,為您提供對(duì)蛋白質(zhì)組學(xué)、基因組學(xué)和醫(yī)學(xué)的卓越洞見。旗下著名的PEAKS系列軟件在全世界擁有數(shù)千家學(xué)術(shù)和工業(yè)用戶,包括:PEAKS Studio,PEAKS Online,PEAKS GlycanFinder, PEAKS AB及抗體綜合表征服務(wù)等。
聯(lián)系方式:021-60919891;sales-china@bioinfor.com