PEAKS DeepNovo多肽從頭測序多解決方案詳解
瀏覽次數(shù):1150 發(fā)布日期:2023-9-12
來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
眾所周知,PEAKS被業(yè)界認(rèn)為是多肽從頭測序的金標(biāo)準(zhǔn)。為了進(jìn)一步推動從頭測序技術(shù)的發(fā)展,2017年,BSI率先將深度學(xué)習(xí)技術(shù)引入質(zhì)譜數(shù)據(jù)的多肽從頭測序中,并報道了其準(zhǔn)確性顯著提高[1,2]。這項技術(shù)的速度和準(zhǔn)確性自然驅(qū)動了我們將DeepNovo整合到PEAKS的解決方案中。
作為從質(zhì)譜(MS)數(shù)據(jù)中發(fā)現(xiàn)全新多肽的關(guān)鍵技術(shù),DeepNovo提供了先進(jìn)的解決方案,并將進(jìn)一步推動抗體測序和新抗原發(fā)現(xiàn)等研究。
主要特點(diǎn)
- 整合深度神經(jīng)網(wǎng)絡(luò)模型,可在氨基酸水平和多肽水平上提高準(zhǔn)確度
- 利用GPU加速從頭測序
- 在不同的MS技術(shù)下,多肽從頭測序均得以提升
當(dāng)使用Bruker timsTOF SCP數(shù)據(jù)[3]進(jìn)行測試時,DeepNovo在氨基酸水平和肽水平上的準(zhǔn)確率分別比我們之前的PEAKS de novo算法高20.5%和16.6%(表1)。此外,使用ThermoFisher Orbitrap數(shù)據(jù)[4]也有顯著改善,在氨基酸和肽水平上的準(zhǔn)確率分別提高了5.5%和10.6%(表2)。
在本組測試中,我們比較了PEAKS DB,PEAKS de novo以及DeepNovo的多肽。我們比較多肽序列之間的交集,以及由PEAKS de novo 和DeepNovo的氨基酸的交集。PEAKS de novo 和DeepNovo大約有64% 以上的重疊。PEAKS DB的結(jié)果作為基準(zhǔn),更重要的是與PEAKS de novo 相比,DeepNovo與PEAKS DB有更多的多肽是共同的。
圖1 維恩圖左邊是PEAKS DB,PEAKS de novo 和DeepNovo的多肽的比較,右圖為PEAKS de novo 和DeepNovo氨基酸的比較。
為了利用DeepNovo建立新的肽得分閾值,我們使用timsTOF和Orbitrap數(shù)據(jù)比較了PEAKS de novo和DeepNovo結(jié)果之間的氨基酸準(zhǔn)確性和得分分布。在這兩種情況下,DeepNovo在得分閾值為55時,氨基酸水平上達(dá)到了~95%的準(zhǔn)確率,而在相同的得分截止值下,de novo肽在氨基酸預(yù)測方面的準(zhǔn)確率約為~80%。這些結(jié)果表明,使用深度學(xué)習(xí)技術(shù)可以提高多肽測序的準(zhǔn)確性。與此結(jié)果一致的是,我們對許多大型公共數(shù)據(jù)集和內(nèi)部數(shù)據(jù)的經(jīng)驗表明,在使用PEAKS de novo和DeepNovo(對于timsTOF數(shù)據(jù))時,要求多肽從頭測序氨基酸水平達(dá)到約95%準(zhǔn)確率時,對應(yīng)的得分閾值分別需要最低80分和55分。
Reference
01. Tran, N. H., et al. (2017). De novo peptide sequencing by deep learning. Proceedings of the National Academy of Sciences of the United States of America, 114(31), 8247–8252. https://doi.org/10.1073/pnas.1705691114
02. Tran, N. H., et al. (2019). Deep learning enables de novo peptide sequencing from data-independent-acquisition mass spectrometry. Nature methods, 16(1), 63–66. https://doi.org/10.1038/s41592-018-0260-3
03. Phulphagar KM, et al. (2023). Sensitive, high-throughput HLA-I and HLA-II immunopeptidomics using parallel accumulation-serial fragmentation mass spectrometry. bioRxiv. 532106. doi: 10.1101/2023.03.10.532106
04. Tretter C, et al. (2023). Proteogenomic analysis reveals RNA as a source for tumor-agnostic neoantigen identification. Nat Commun. 14(1):4632. doi: 10.1038/s41467-023-39570-7