基于質(zhì)譜的蛋白質(zhì)組學(xué)的最新進(jìn)展極大地?cái)U(kuò)展了其在生物醫(yī)學(xué)和臨床研究中的影響力。作者對(duì)人肝臟和血漿這兩種類型樣本進(jìn)行單獨(dú)及綜合的分析,以病理特征和疾病階段依賴性的方式系統(tǒng)地表征肝臟和血漿中的蛋白質(zhì)組變化。然后通過將機(jī)器學(xué)習(xí),確定了用于同時(shí)檢測(cè)“顯著”纖維化(纖維化階段≥F2),輕度炎癥活動(dòng)和任何脂肪變性的生物標(biāo)志物組合。
本篇由德國(guó)馬普生物化學(xué)研究所Matthias Mann教授聯(lián)合Aleksander Krag教授課題組在Nature Medicine醫(yī)學(xué)一區(qū)期刊(IF:87.241)上發(fā)表的題為 “Noninvasive proteomic biomarkers for alcohol-related liver disease”的研究成果,以人肝臟、人血漿為研究對(duì)象,采用deep高深度微量血液蛋白質(zhì)組-DIA蛋白組學(xué)分析了酒精性肝病患者和正常對(duì)照的肝和血漿蛋白組,找到了差異蛋白,然后通過機(jī)器學(xué)習(xí)算法確定了三組蛋白生物標(biāo)志物組合,這些組合具有良好的診斷準(zhǔn)確性和預(yù)后能力。
研究思路
研究結(jié)果
1.患者、數(shù)據(jù)收集和研究設(shè)計(jì)
作者使用非依賴性采集(DIA)模式檢測(cè)了所有受試者的血漿蛋白以及衍生隊(duì)列中的79個(gè)肝活檢蛋白質(zhì)組,總共量化了5515種蛋白質(zhì)。
圖1 | 蛋白質(zhì)組學(xué)流程
2.肝臟病變對(duì)肝臟和血漿蛋白質(zhì)組的影響
肝臟蛋白質(zhì)組差異分析顯示658種蛋白在纖維化階段顯著失調(diào),135種差異蛋白參與了炎癥活動(dòng),以及68個(gè)差異蛋白涉及到脂肪變性。共717種獨(dú)特蛋白質(zhì),占肝臟蛋白質(zhì)組總定量的13%(圖2a)。纖維化對(duì)肝臟蛋白質(zhì)組的影響最大,其次是炎癥。失調(diào)蛋白中,“肝臟特異性”的蛋白和注釋為“分泌”的蛋白的情況(圖2c)與之前在NAFLD和肝硬化的研究中報(bào)道的情況相似。
圖2 | 肝臟病變引起的肝臟蛋白質(zhì)組重塑
血漿蛋白質(zhì)組分析顯示,225個(gè)蛋白在纖維化(206個(gè)蛋白質(zhì))、炎癥活性(163個(gè)蛋白質(zhì))和脂肪變性(48個(gè)蛋白質(zhì))的組織學(xué)階段過程中豐度發(fā)生顯著變化(圖3a)。其中,隨著纖維化程度的增加,134種蛋白質(zhì)上調(diào),91種蛋白下調(diào)(圖3b)。
圖3 | 由于肝臟病變重塑的血漿蛋白質(zhì)組
3.肝臟和血漿蛋白質(zhì)組學(xué)的整合
總共有420種蛋白質(zhì)在肝臟和血漿中被定量(圖4a)。它們表現(xiàn)出雙峰模式,“對(duì)角線簇”上的蛋白在肝臟和血漿中中相對(duì)豐度排名在很大程度上是相關(guān)的,而“垂直簇”的蛋白則沒有相關(guān)性(圖4b)。一般來說,細(xì)胞內(nèi)酶是“垂直簇”的一部分;而對(duì)“角線簇”則包含有多種不同功能的血漿蛋白(圖4c)。
圖4 | 肝-血漿蛋白質(zhì)組的整合
總的來說,46種蛋白質(zhì)在肝臟和血漿蛋白質(zhì)組中共失調(diào)(圖4g)。這些代表免疫和炎癥反應(yīng)、細(xì)胞粘附、ECM組織、蛋白酶抑制劑和細(xì)胞內(nèi)酶(圖4g)。它們可能是免疫細(xì)胞浸潤(rùn)和全身炎癥增加、肝纖維化中的ECM重塑和瘢痕組織形成以及組織滲漏造成的。
4.用于酒精性肝病早期病理學(xué)的生物標(biāo)志物組合
作者首先比較了22個(gè)最先進(jìn)的機(jī)器學(xué)習(xí)分類器,并確定了一個(gè)邏輯回歸模型作為最終的分類器。使用“最小冗余–最大相關(guān)性”(mRMR)特征選擇算法,作者最后篩選出了由9個(gè)生物標(biāo)志物蛋白組合來識(shí)別顯著纖維化;6個(gè)蛋白組合用于識(shí)別輕度炎癥活動(dòng)以及12個(gè)蛋白的組合來識(shí)別肝脂肪變性。三個(gè)生物標(biāo)志物組合共含有22個(gè)蛋白(圖6),有7種在血漿和肝臟中均有共調(diào)節(jié);谒x標(biāo)記物組的Logistic回歸模型的交叉驗(yàn)證顯示三種組合的平均ROC-AUC分別為0.90(顯著纖維化)、0.85(輕度炎癥活動(dòng))和0.91(脂肪變性)(圖5a,d和g)。與使用廣泛的15項(xiàng)臨床模型相比,所有蛋白質(zhì)組學(xué)模型都具有最高的F1分?jǐn)?shù)和準(zhǔn)確性(圖5);
圖5 | 基于血漿蛋白質(zhì)組的預(yù)測(cè)模型,用于活檢驗(yàn)證的纖維化、炎癥和脂肪變性
圖6 | 所選標(biāo)記面板中蛋白質(zhì)的豐度分布
5.在獨(dú)立隊(duì)列中驗(yàn)證模型性能
蛋白質(zhì)組學(xué)模型在健康匹配的對(duì)照隊(duì)列(n = 136)中正確排除了顯著纖維化、晚期纖維化和輕度炎癥,準(zhǔn)確率分別為99%、100和98%(圖7a)。對(duì)于有酒精濫用史且由于肝硬度低(n = 97)而未進(jìn)行活檢的患者亞組,蛋白質(zhì)組學(xué)模型分辨顯著纖維化和晚期纖維化的準(zhǔn)確性分別為93%和100%(圖7a)。在獨(dú)立的ALD驗(yàn)證隊(duì)列(n = 63)中,F(xiàn)2和I2模型的ROC-AUC分別為0.87和0.81,高于其他分類器(圖7 b和c)。
圖7 | 驗(yàn)證模型性能和評(píng)估預(yù)后能力
6.蛋白質(zhì)組學(xué)模型能準(zhǔn)確進(jìn)行預(yù)后測(cè)量
對(duì)丹麥的457名GALA-ALD隊(duì)列患者進(jìn)行隨訪記錄,并定義了兩個(gè)主要結(jié)局:肝臟相關(guān)事件(LREs)和全因死亡。將蛋白質(zhì)組學(xué)模型與商業(yè)性生物標(biāo)志物和肝纖維化的組織學(xué)分期進(jìn)行了比較,F(xiàn)2蛋白質(zhì)組學(xué)模型對(duì)LRE的預(yù)測(cè)準(zhǔn)確性最高(圖7d-f ),AUC 分別為 0.945(3年)和0.933(5年)。對(duì)于全因死亡,F(xiàn)2蛋白質(zhì)組學(xué)模型也表現(xiàn)最好,3年和5年AUC分別為0.836和0.818(圖7g-i)。
研究結(jié)論
酒精相關(guān)性肝病(ALD)是全球肝臟相關(guān)死亡的主要原因,但對(duì)該疾病的三個(gè)關(guān)鍵病理特征 :纖維化、炎癥和脂肪變性的了解仍然不完整。研究者使用配對(duì)的肝-血漿蛋白質(zhì)組學(xué)方法來推斷分子病理生理學(xué)。并探索血漿蛋白質(zhì)組學(xué)在596人中的診斷和預(yù)后能力。然后使用機(jī)器學(xué)習(xí)模型確定了蛋白質(zhì)組學(xué)生物標(biāo)志物組合,這些組合在檢測(cè)顯著纖維化和輕度炎癥上比現(xiàn)有的臨床檢測(cè)更準(zhǔn)確。此外這些生物標(biāo)志物組合在預(yù)測(cè)未來肝臟相關(guān)事件和全因死亡率方面是準(zhǔn)確的。
小鹿推薦
使用DIA蛋白組技術(shù)檢測(cè)了人肝臟和血漿蛋白,并找到了三組蛋白質(zhì)生物標(biāo)志物組合,能夠在發(fā)現(xiàn)隊(duì)列以及驗(yàn)證隊(duì)列中準(zhǔn)確的診斷和預(yù)后。數(shù)據(jù)非依賴采集(data independent acquisition,DIA)是近年來備受關(guān)注的質(zhì)譜采集技術(shù)之一,引領(lǐng)了定量蛋白質(zhì)組新發(fā)展。