多肽從頭測序de novo Sequencing技術(shù)詳解
瀏覽次數(shù):1074 發(fā)布日期:2023-4-10
來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
多肽從頭測序(de novo sequencing)是指在不借助序列數(shù)據(jù)庫的情況下,通過串聯(lián)質(zhì)譜(MS/MS)得到多肽氨基酸序列的分析過程。這與另一種流行的肽段鑒定方法--“數(shù)據(jù)庫搜索”形成了鮮明對比,即在給定的數(shù)據(jù)庫中搜索以找到目標(biāo)肽。從頭測序的一個明顯優(yōu)勢是它既適用于數(shù)據(jù)庫搜索,也適用于新肽。
01 | 基本原理
在串聯(lián)質(zhì)譜中,質(zhì)譜通過對肽鏈碎裂產(chǎn)生的碎片離子檢測,進(jìn)而產(chǎn)生ms/ms譜。根據(jù)所采用的碎裂方法,可以產(chǎn)生不同的碎片離子類型。目前應(yīng)用最廣泛的碎裂方法是碰撞誘導(dǎo)解離(CID)和電子轉(zhuǎn)移解離(ETD),CID主要產(chǎn)生b和y離子,ETD主要產(chǎn)生c和z離子。
圖1. 在CID碎裂的MS/MS 譜圖中,相同肽段的多個拷貝沿著肽骨架碎裂成為b、y離子。產(chǎn)生的譜圖由以橫坐標(biāo)為m/z (質(zhì)荷比)的峰構(gòu)成,其值由碎片離子的響應(yīng)構(gòu)成。高質(zhì)量的譜圖通常包含了許多(但不一定是全部)的理論碎片離子。
de novo sequencing的主要思路是用兩個碎片離子之間的質(zhì)量差值來計算肽主鏈上氨基酸殘基的質(zhì)量。質(zhì)量數(shù)通?梢元毺氐卮_定殘基的類型。例如,在圖1中y7和y6的質(zhì)量差值為129,即E的殘基質(zhì)量數(shù)。同理,下一個相鄰的殘基,可以通過y6和y5之間的質(zhì)量差確定為L。該解譜過程會進(jìn)行下去,直到所有的氨基酸殘基都被確定。
因此,如果能在譜圖中識別出y離子或b離子序列,就可以確定肽的序列。然而,質(zhì)譜儀獲得的譜圖并不能告訴我們峰的離子類型,這需要專家或計算機算法在從頭測序過程中計算出來。一些因素會給這一過程帶來困難,比如:
- 不正確的b、y離子分配
- 一些離子碎片的缺失(比如圖1中的 b1、y8)
- 譜圖中其他碎片離子類型(比如圖1中的 b3-NH3)
- 譜圖中存在噪音峰
- 高度相似的氨基酸殘基質(zhì)量數(shù)(I=L and K=Q)
- 殘基上的PTM(翻譯后修飾)可能導(dǎo)致質(zhì)量模糊,并使肽碎片類型復(fù)雜化
以上這些因素,可能導(dǎo)致de novo測序只能從譜圖中計算出部分正確的序列標(biāo)簽
02 | 自動化的de novo測序
手動進(jìn)行de novo測序的解譜工作要求人員的專業(yè)性,并且十分地費時。一個可靠的自動化de novo測序解決方案可以節(jié)省寶貴的人工時間,并大大降低了實驗室的人工成本。自動化de novo測序在生物信息學(xué)領(lǐng)域得到了廣泛的研究,并開發(fā)了多種算法,雖然計算機算法所使用的基本原理與人工de novo測序相同,但計算機算法的執(zhí)行過程通常與人工分析不盡相同。
PEAKS Studio軟件于2002年首次發(fā)布,目前已成為自動化從頭測序的行業(yè)標(biāo)準(zhǔn)軟件,并以其準(zhǔn)確性、快速分析的能力,以及用戶友好性而聞名。
03 | 結(jié)合數(shù)據(jù)庫搜索使用
過去,人們常認(rèn)為de novo測序分析的速度非常慢。因此,只有在蛋白質(zhì)數(shù)據(jù)庫不可用的情況下,才使用de novo測序的方法。然而,隨著計算機算法(如PEAKS)的最新發(fā)展,速度已不再是問題。這使得在蛋白質(zhì)組學(xué)研究中對得到的每一張質(zhì)譜圖都進(jìn)行de novo測序成為一種可行的選擇。即使是當(dāng)數(shù)據(jù)庫可用的情況下,de novo測序也可以通過以下方式幫助多肽的鑒定。
1. de novo測序肽段與數(shù)據(jù)庫搜索肽段之間的匹配或相似度可以很好地說明數(shù)據(jù)庫搜索結(jié)果的正確性。因此,從頭測序可用于提高數(shù)據(jù)庫搜索性能。
2. de novo測序得到的肽段如果在數(shù)據(jù)庫中沒有顯著匹配,可能是在樣品中存在全新的肽段,值得進(jìn)一步確定,有可能發(fā)現(xiàn)預(yù)期外的PTM或者多肽的突變。
如下圖2所示,PEAKS Studio軟件在設(shè)置標(biāo)準(zhǔn)操作流程的時候,已經(jīng)考慮到了這個問題。
圖2. 充分利用de novo測序 的標(biāo)準(zhǔn)PEAKS Studio工作流程
參考文獻(xiàn)
1.Tran NH, Qiao R, Xin L, Chen X, Liu C, Zhang X, Shan B, Ghodsi A, Li M. Deep learning enables de novo peptide sequencing from data-independent-acquisition mass spectrometry. Nature Methods. 16(1), 63-66. 20/12/2018.
2.Hughes, C., Ma, B., Lajoie, G.A. De novo Sequencing Methods in Proteomics. Methods Mol Biol. 2010;604:105-21.
3.Ma, B. & Johnson, R. De novo Sequencing and Homology Searching. Molecular & Cellular Proteomics. 2012;11(2).
(點擊圖片即可查看活動詳情)
如果您想深入了解更多de novo Sequencing技術(shù)介紹和應(yīng)用,歡迎掃描下方二維碼關(guān)注我們!