圖1. 文章標(biāo)題
當(dāng)研究人員為人類基因組測序的成功而歡欣鼓舞時,一個新興的前沿方向悄然出現(xiàn):蛋白質(zhì)組學(xué)。蛋白組學(xué)的目的是識別和研究人體或其他生物體組織/細(xì)胞樣本中的一整套蛋白質(zhì)的表達(dá)。與基因組最大的不同在于蛋白質(zhì)組可以揭示蛋白表達(dá)的時空變化,從而描述生命體當(dāng)前的健康狀況,而不僅僅是基因檢測預(yù)測的疾病風(fēng)險。
美國國立衛(wèi)生研究院蛋白質(zhì)組學(xué)科學(xué)興趣小組的共同主席 Aleksandra Nita Lazar 博士在接受 JAMA 采訪時說“蛋白質(zhì)組學(xué)的復(fù)雜性是蛋白組學(xué)研究的一個重大挑戰(zhàn)”。這就是為什么要花這么長時間才能獲得每個生命體的完整蛋白質(zhì)組,因為蛋白質(zhì)表達(dá)隨機(jī)體內(nèi)外部環(huán)境的變化而變化。
與此同時,蛋白質(zhì)組學(xué)在醫(yī)學(xué)中的潛力正在顯現(xiàn),越來越多的研究顯示某些蛋白質(zhì)和蛋白質(zhì)組圖譜與疾病有關(guān)。如 PLOS Digital Health 最近的一項研究探討了需要重癥監(jiān)護(hù)的新冠肺炎患者的蛋白質(zhì)組預(yù)測因子。
圖2. 蛋白組學(xué)進(jìn)行重癥監(jiān)護(hù)的新冠肺炎患者的蛋白質(zhì)組預(yù)測因子篩選
Scientific Reports 和 eBioMedicine 探討了血漿蛋白質(zhì)組分析如何確定新冠肺炎病例的嚴(yán)重程度。
目前,研究人員已經(jīng)建立了人類蛋白質(zhì)組的圖譜庫:人體內(nèi)表達(dá)的整套蛋白質(zhì)組。由于每種細(xì)胞類型都有自己獨(dú)特的蛋白質(zhì)組以及蛋白質(zhì)存在的不同形態(tài),所以人類蛋白質(zhì)組由不同的亞蛋白質(zhì)組共同組成,另外還有蛋白質(zhì)存在形式(proteoforms),共同組成一個蛋白質(zhì)組,這些蛋白質(zhì)組是由基因組產(chǎn)生的蛋白質(zhì)的變體或存在形式(forms)。
美國西北大學(xué)蛋白質(zhì)組學(xué)和生物化學(xué)研究所所長 Neil Kelleher 博士在接受 JAMA 采訪時說:“同一個基因可以產(chǎn)生具有細(xì)微差異的多種蛋白質(zhì)。例如,在肝臟、大腦、腎臟或血液和骨髓中的造血系統(tǒng)中表達(dá)的人類基因,卻創(chuàng)造了大量不同的在以前蛋白組數(shù)據(jù)中沒出現(xiàn)過的蛋白質(zhì)存在形式(proteoforms)。”
現(xiàn)在,研究人員旨在建立一組人類參考蛋白質(zhì)存在形式(proteoforms)的圖譜,并希望完成整個人類蛋白質(zhì)存在形式(proteoforms)的圖譜繪制。
蛋白組學(xué)簡史
蛋白組學(xué)的開端
1975年,研究人員使用二維(2D)凝膠電泳技術(shù)繪制了小鼠、豚鼠和大腸桿菌蛋白質(zhì)的圖譜,并按電荷和大小分離蛋白質(zhì),是發(fā)表的關(guān)于蛋白質(zhì)組學(xué)的最早研究。2D凝膠電泳技術(shù)是一種用于分離、分級和分析從生物樣品中提取的蛋白質(zhì)的技術(shù),有助于實現(xiàn)蛋白質(zhì)組學(xué)研究。
20世紀(jì)90年代和21世紀(jì)初,人們在蛋白質(zhì)和基因組學(xué)領(lǐng)域取得了進(jìn)一步進(jìn)展,第一批微生物基因組測序完成并為人類基因組計劃奠定了基礎(chǔ)。到了世紀(jì)之交,蛋白質(zhì)分析不再依賴于2D凝膠,而質(zhì)譜技術(shù)的進(jìn)步允許分析氣相中的離子化蛋白質(zhì)。研究人員可以通過將蛋白質(zhì)片段化并利用質(zhì)譜技術(shù)實現(xiàn)更好的鑒定。同時超越以往只能對單個蛋白質(zhì)進(jìn)行鑒定的局限,實現(xiàn)對復(fù)雜的蛋白質(zhì)混合物進(jìn)行鑒定。不過,當(dāng)時詞典中還沒有用來描述蛋白質(zhì)研究的術(shù)語。
決定性時刻
雖然關(guān)于蛋白質(zhì)組學(xué)的最初研究是在50年前發(fā)表的,但包括 Marc Wilkins 博士(目前為澳大利亞悉尼新南威爾士大學(xué)(UNSW)的系統(tǒng)生物學(xué)教授)在內(nèi)的一組研究人員直到1994年才命名了”proteome“(蛋白質(zhì)組)一詞。Marc Wilkins 當(dāng)時作為博士研究生在意大利參加2D電泳的會議,發(fā)表了一篇關(guān)于蛋白質(zhì)鑒定技術(shù)的合著論文,并提出了這個新的術(shù)語。
Marc Wilkins 在接受 JAMA 采訪時回憶道:“雖然當(dāng)時可以描述基因組中的所有基因,但沒有辦法對蛋白質(zhì)做同樣的事情。” 他的解決方案是:“很明顯,蛋白質(zhì)‘protein’與‘-ome’結(jié)合在一起,因為‘-ome’已經(jīng)被用于基因組 ‘genome’ 和生物群系 ‘biome’ 。” 因此,提出了蛋白質(zhì)組 proteome 這個詞。
1995年,Marc Wilkins 在 Electrophoresis 雜志上發(fā)表了第一篇提到蛋白質(zhì)組 ‘proteome’ 的文章。他和他的同事寫道“蛋白質(zhì)組(proteome)是指基因組的所有蛋白質(zhì)組合”。Wilkins 在 Biotechnology and Genetic Engineering Reviews 合著的另一篇文章進(jìn)一步定義了該術(shù)語:“作為‘基因組計劃’概念的延申,‘蛋白質(zhì)組計劃’是旨在識別和表征細(xì)胞或組織中存在的蛋白質(zhì)并定義其表達(dá)模式的研究。”
時隔20年,Kelleher 和他的同事 Lloyd Smith 博士,威斯康辛大學(xué)麥迪遜分校的化學(xué)教授,又提出 “proteoform” 一詞“指單個基因的蛋白質(zhì)產(chǎn)物可以在其中找到的所有不同分子形式,包括基因變異、選擇性剪接RNA轉(zhuǎn)錄和翻譯后修飾引起的變化。”
重大事件
通過使用不同方法開展的多個項目共同推進(jìn)完成人類蛋白質(zhì)組圖譜。人類蛋白質(zhì)組組織(HUPO)的人類蛋白質(zhì)組項目(HPP)就是其中之一。截至2022年3月,HPP 已發(fā)現(xiàn)93.2%的人類蛋白質(zhì)組,鑒定了 18,407 種蛋白質(zhì),人類基因組編碼蛋白質(zhì)估計共有 19,750 個。
沒有正式參與 HPP 的 HUPO 理事會成員 Wilkins 說:“我們可以從基因組中預(yù)測人類蛋白質(zhì)組中應(yīng)該包含的蛋白質(zhì)數(shù)量是一個好消息。” 而計算蛋白質(zhì)存在形式(proteoforms)是一項更大的工作,因為蛋白質(zhì)存在形式(proteoforms)比蛋白質(zhì)多得多。截止2022年8月,人類蛋白質(zhì)存在形式(proteoforms)項目已經(jīng)確定了共有 61,770 種,但這還遠(yuǎn)沒有達(dá)到蛋白質(zhì)存在形式(proteoforms)的總數(shù)。人類蛋白質(zhì)形式項目帶頭人和蛋白質(zhì)組學(xué)聯(lián)合會的董事會主席 Kelleher 說到:“從亞洲的角度來看,我們所討論的是定義大約5000萬到1億種獨(dú)特的蛋白質(zhì)存在形式(proteoforms)”。
未來發(fā)展
過去的工作給我們提供了一些可用的蛋白質(zhì)數(shù)據(jù)庫。人類蛋白質(zhì)圖譜(HPA)是一個蛋白質(zhì)分類的開放存取數(shù)據(jù)庫。UniProt 和 neXtProt 平臺還發(fā)布了關(guān)于蛋白質(zhì)的信息,同時會持續(xù)跟蹤仍需要進(jìn)一步研究蛋白質(zhì),例如功能未知的蛋白質(zhì)。
開源人工智能系統(tǒng)(如AlphaFold)預(yù)測了地球上存在的超過2億種的蛋白質(zhì)結(jié)構(gòu)。當(dāng)研究人員輸入一個蛋白質(zhì)序列時,AlphaFold 會輸出一個預(yù)測的結(jié)構(gòu)。這一點(diǎn)特別重要,因為蛋白質(zhì)的結(jié)構(gòu)會影響其功能。美國國家變態(tài)反應(yīng)和傳染病研究所國家細(xì)胞網(wǎng)絡(luò)蛋白質(zhì)組單元的高級研究員、HUPO 生物與疾病驅(qū)動的人類蛋白質(zhì)組項目的執(zhí)行委員會成員 Nita Lazar 說到:”AlphaFold 非常有用……我們也在使用它,非常具有互動性和協(xié)作性。”
蛋白質(zhì)組分析也被用于研究其他疾病。錯誤折疊的蛋白質(zhì)會導(dǎo)致蛋白質(zhì)。╬roteinopathies),例如阿爾茨海默病和帕金森病。一些研究已經(jīng)揭示了阿爾茨海默病患者大腦中的蛋白質(zhì)組變化。
應(yīng)用蛋白質(zhì)組學(xué)的另一個領(lǐng)域是癌癥研究:2011年,美國國家癌癥研究所成立了臨床蛋白質(zhì)組學(xué)腫瘤分析聯(lián)盟,以通過蛋白質(zhì)基因組學(xué)(proteogenomics)更好地了解癌癥,這是一種整合蛋白質(zhì)組學(xué)和基因組學(xué)的方法。德克薩斯大學(xué)安德森癌癥中心也有一個癌癥蛋白質(zhì)組學(xué)研究平臺,希望它能推進(jìn)旨在提高癌癥患者生存率的登月計劃。
DECODING THE MICROWORLD
正如 Wilkins 所說,“從事蛋白質(zhì)組學(xué)研究的每個人都站在彼此的肩膀上。值得一提的是,有這么多不同方法的人聚集在一起,試圖共同實現(xiàn)這一切。”
我們期待蛋白質(zhì)組學(xué)的發(fā)展將越來越蓬勃。
西湖歐米科研服務(wù)
西湖歐米創(chuàng)立于2020年7月,是一家專注于AI賦能的蛋白質(zhì)組大數(shù)據(jù)公司。我們致力于以技術(shù)創(chuàng)新為驅(qū)動力,以多模態(tài)大數(shù)據(jù)為基礎(chǔ),使用AI賦能微量臨床樣本的高通量蛋白質(zhì)組分析等組學(xué)技術(shù)輔助精準(zhǔn)醫(yī)學(xué)和藥物研發(fā)。西湖歐米擁有一支專業(yè)的團(tuán)隊,有豐富的項目經(jīng)驗,為您的樣本保駕護(hù)航。
如有意向,歡迎咨詢
聯(lián)系我們 CONTACT US:
郵箱:service@westlakeomics.com
座機(jī):0571-86780630