PEAKS SPIDER算法在同源突變分析的應(yīng)用
瀏覽次數(shù):859 發(fā)布日期:2023-8-4
來(lái)源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
生物樣品中的蛋白質(zhì)序列通常和數(shù)據(jù)庫(kù)中相應(yīng)的蛋白序列有略微差異,這些差異很多是由蛋白多態(tài)性、抗體多樣性、數(shù)據(jù)庫(kù)誤差、跨物種數(shù)據(jù)庫(kù)搜索等造成的。序列突變信息的缺失則很可能漏掉潛在的biomarker、抗體確認(rèn)時(shí)引入錯(cuò)誤、甚至蛋白質(zhì)會(huì)有較低的覆蓋率。對(duì)于這些問題,PEAKS SPIDER模塊設(shè)計(jì)用于檢測(cè)序列的突變信息并進(jìn)行跨物種的同源搜索。
概覽// Overview
PEAKS SPIDER算法將de novo sequence tag和database protein進(jìn)行匹配,發(fā)現(xiàn)序列之間存在顯著性的相似,算法則通過從頭測(cè)序錯(cuò)誤和同源肽段序列突變來(lái)解釋這個(gè)差異(Figure1)。更具體說(shuō)是重建一個(gè)”real sequence”,使得正確序列和de novo結(jié)果之間的從頭測(cè)序錯(cuò)誤、正確序列和數(shù)據(jù)庫(kù)蛋白序列的同源多肽突變,這二者的總和最小化。
Q:為什么不用BLAST?
A:常規(guī)的同源搜索工具比如BLAST并不是搜索de novo sequence tags的好的選擇。由于肽段的MS/MS譜中缺失一些片段離子導(dǎo)致可能發(fā)生從頭測(cè)序錯(cuò)誤的現(xiàn)象是很常見的。因此,對(duì)于合適的de novo tag的同源搜索,要有如(AT/TA)和 (N/GG) 這樣的測(cè)序容錯(cuò)。BLAST出于不同的考慮,會(huì)拒絕掉錯(cuò)誤太多的情況,可能顯著降低了搜索靈敏度。另外,BLAST也不會(huì)進(jìn)行真實(shí)肽段序列的重建。
除了明顯的突變檢測(cè)和跨物種搜索功能外,SPIDER另外一個(gè)非常有用的應(yīng)用是可以迭代地使用它來(lái)進(jìn)行一個(gè)完整蛋白質(zhì)的測(cè)序(如抗體測(cè)序),通過以下步驟實(shí)現(xiàn):
- 使用PEAKS標(biāo)準(zhǔn)workflow (de novo + PEAKS DB + PEAKS PTM + SPIDER)進(jìn)行同源數(shù)據(jù)庫(kù)搜索,可以鑒定同源蛋白質(zhì)。
- 然后再覆蓋窗口中選擇工具“copy mutated protein sequence”,這樣可以把突變的蛋白質(zhì)序列(after applying the confident mutations)復(fù)制到Windows剪貼板上。
- 通過粘貼復(fù)制的序列作為蛋白質(zhì)數(shù)據(jù)庫(kù)調(diào)用另一個(gè)標(biāo)準(zhǔn)搜索。
- 多次重復(fù)以上步驟,逐步提高序列質(zhì)量。
References
1.Han, Y., Ma, B., Zhang, K. SPIDER: Software for Protein Identification from Sequence Tags Containing De Novo Sequencing Error. Journal of Bioinformatics and Computational Biology. 3(3):697-716. 1/6/2005.
2.Ma, B. & Johnson, R. De novo Sequencing and Homology Searching. Molecular & Cellular Proteomics. 11(2). 1/2/2012.
(點(diǎn)擊圖片即可查看活動(dòng)詳情)
如果您想深入了解更多關(guān)于PEAKS 軟件更多內(nèi)容,歡迎掃描下方二維碼關(guān)注我們!