基于質(zhì)譜的蛋白質(zhì)組學的最新進展極大地擴展了其在生物醫(yī)學和臨床研究中的影響力。作者對人肝臟和血漿這兩種類型樣本進行單獨及綜合的分析,以病理特征和疾病階段依賴性的方式系統(tǒng)地表征肝臟和血漿中的蛋白質(zhì)組變化。然后通過將機器學習,確定了用于同時檢測“顯著”纖維化(纖維化階段≥F2),輕度炎癥活動和任何脂肪變性的生物標志物組合。
本篇由德國馬普生物化學研究所Matthias Mann教授聯(lián)合Aleksander Krag教授課題組在Nature Medicine醫(yī)學一區(qū)期刊(IF:87.241)上發(fā)表的題為 “Noninvasive proteomic biomarkers for alcohol-related liver disease”的研究成果,以人肝臟、人血漿為研究對象,采用deep高深度微量血液蛋白質(zhì)組-DIA蛋白組學分析了酒精性肝病患者和正常對照的肝和血漿蛋白組,找到了差異蛋白,然后通過機器學習算法確定了三組蛋白生物標志物組合,這些組合具有良好的診斷準確性和預后能力。
研究思路
研究結(jié)果
1.患者、數(shù)據(jù)收集和研究設計
作者使用非依賴性采集(DIA)模式檢測了所有受試者的血漿蛋白以及衍生隊列中的79個肝活檢蛋白質(zhì)組,總共量化了5515種蛋白質(zhì)。
圖1 | 蛋白質(zhì)組學流程
2.肝臟病變對肝臟和血漿蛋白質(zhì)組的影響
肝臟蛋白質(zhì)組差異分析顯示658種蛋白在纖維化階段顯著失調(diào),135種差異蛋白參與了炎癥活動,以及68個差異蛋白涉及到脂肪變性。共717種獨特蛋白質(zhì),占肝臟蛋白質(zhì)組總定量的13%(圖2a)。纖維化對肝臟蛋白質(zhì)組的影響最大,其次是炎癥。失調(diào)蛋白中,“肝臟特異性”的蛋白和注釋為“分泌”的蛋白的情況(圖2c)與之前在NAFLD和肝硬化的研究中報道的情況相似。
圖2 | 肝臟病變引起的肝臟蛋白質(zhì)組重塑
血漿蛋白質(zhì)組分析顯示,225個蛋白在纖維化(206個蛋白質(zhì))、炎癥活性(163個蛋白質(zhì))和脂肪變性(48個蛋白質(zhì))的組織學階段過程中豐度發(fā)生顯著變化(圖3a)。其中,隨著纖維化程度的增加,134種蛋白質(zhì)上調(diào),91種蛋白下調(diào)(圖3b)。
圖3 | 由于肝臟病變重塑的血漿蛋白質(zhì)組
3.肝臟和血漿蛋白質(zhì)組學的整合
總共有420種蛋白質(zhì)在肝臟和血漿中被定量(圖4a)。它們表現(xiàn)出雙峰模式,“對角線簇”上的蛋白在肝臟和血漿中中相對豐度排名在很大程度上是相關的,而“垂直簇”的蛋白則沒有相關性(圖4b)。一般來說,細胞內(nèi)酶是“垂直簇”的一部分;而對“角線簇”則包含有多種不同功能的血漿蛋白(圖4c)。
圖4 | 肝-血漿蛋白質(zhì)組的整合
總的來說,46種蛋白質(zhì)在肝臟和血漿蛋白質(zhì)組中共失調(diào)(圖4g)。這些代表免疫和炎癥反應、細胞粘附、ECM組織、蛋白酶抑制劑和細胞內(nèi)酶(圖4g)。它們可能是免疫細胞浸潤和全身炎癥增加、肝纖維化中的ECM重塑和瘢痕組織形成以及組織滲漏造成的。
4.用于酒精性肝病早期病理學的生物標志物組合
作者首先比較了22個最先進的機器學習分類器,并確定了一個邏輯回歸模型作為最終的分類器。使用“最小冗余–最大相關性”(mRMR)特征選擇算法,作者最后篩選出了由9個生物標志物蛋白組合來識別顯著纖維化;6個蛋白組合用于識別輕度炎癥活動以及12個蛋白的組合來識別肝脂肪變性。三個生物標志物組合共含有22個蛋白(圖6),有7種在血漿和肝臟中均有共調(diào)節(jié);谒x標記物組的Logistic回歸模型的交叉驗證顯示三種組合的平均ROC-AUC分別為0.90(顯著纖維化)、0.85(輕度炎癥活動)和0.91(脂肪變性)(圖5a,d和g)。與使用廣泛的15項臨床模型相比,所有蛋白質(zhì)組學模型都具有最高的F1分數(shù)和準確性(圖5);
圖5 | 基于血漿蛋白質(zhì)組的預測模型,用于活檢驗證的纖維化、炎癥和脂肪變性
圖6 | 所選標記面板中蛋白質(zhì)的豐度分布
5.在獨立隊列中驗證模型性能
蛋白質(zhì)組學模型在健康匹配的對照隊列(n = 136)中正確排除了顯著纖維化、晚期纖維化和輕度炎癥,準確率分別為99%、100和98%(圖7a)。對于有酒精濫用史且由于肝硬度低(n = 97)而未進行活檢的患者亞組,蛋白質(zhì)組學模型分辨顯著纖維化和晚期纖維化的準確性分別為93%和100%(圖7a)。在獨立的ALD驗證隊列(n = 63)中,F(xiàn)2和I2模型的ROC-AUC分別為0.87和0.81,高于其他分類器(圖7 b和c)。
圖7 | 驗證模型性能和評估預后能力
6.蛋白質(zhì)組學模型能準確進行預后測量
對丹麥的457名GALA-ALD隊列患者進行隨訪記錄,并定義了兩個主要結(jié)局:肝臟相關事件(LREs)和全因死亡。將蛋白質(zhì)組學模型與商業(yè)性生物標志物和肝纖維化的組織學分期進行了比較,F(xiàn)2蛋白質(zhì)組學模型對LRE的預測準確性最高(圖7d-f ),AUC 分別為 0.945(3年)和0.933(5年)。對于全因死亡,F(xiàn)2蛋白質(zhì)組學模型也表現(xiàn)最好,3年和5年AUC分別為0.836和0.818(圖7g-i)。
研究結(jié)論
酒精相關性肝病(ALD)是全球肝臟相關死亡的主要原因,但對該疾病的三個關鍵病理特征 :纖維化、炎癥和脂肪變性的了解仍然不完整。研究者使用配對的肝-血漿蛋白質(zhì)組學方法來推斷分子病理生理學。并探索血漿蛋白質(zhì)組學在596人中的診斷和預后能力。然后使用機器學習模型確定了蛋白質(zhì)組學生物標志物組合,這些組合在檢測顯著纖維化和輕度炎癥上比現(xiàn)有的臨床檢測更準確。此外這些生物標志物組合在預測未來肝臟相關事件和全因死亡率方面是準確的。
小鹿推薦
使用DIA蛋白組技術檢測了人肝臟和血漿蛋白,并找到了三組蛋白質(zhì)生物標志物組合,能夠在發(fā)現(xiàn)隊列以及驗證隊列中準確的診斷和預后。數(shù)據(jù)非依賴采集(data independent acquisition,DIA)是近年來備受關注的質(zhì)譜采集技術之一,引領了定量蛋白質(zhì)組新發(fā)展。