帕金森病(PD)是第二常見的神經(jīng)退行性疾病,在世界范圍內(nèi)日益增長,影響著全世界數(shù)百萬人,并且隨著年齡的增長發(fā)病率顯著增加。但迄今為止,在臨床上還沒有可靠的生物標志物。2022年6月Matthias Mann及Sebastian Virreira Winter等團隊在Cell Reports Medicine上發(fā)表名為“Proteome profiling of cerebrospinal fluid reveals biomarker candidates for Parkinson’s disease”的文章,使用腦脊液蛋白質(zhì)組分析以發(fā)現(xiàn)帕金森病的候選生物標志物。在文章中,研究者描述了一個可擴展和靈敏的基于質(zhì)譜(MS)的蛋白質(zhì)組學(xué)工作流程,用于腦脊液蛋白質(zhì)組分析。研究者從腦脊液中重復(fù)量化了超過1700個蛋白質(zhì)。使用機器學(xué)習(xí)篩選出了PD患者中OMD、CD44、VGF、PRL和MAN2B1的改變以及與臨床評分顯著相關(guān)。研究者還發(fā)現(xiàn)在LRRK2、G2019S攜帶者中存在神經(jīng)炎癥的特征。最后與研究者之前獲得的尿液蛋白質(zhì)組的數(shù)據(jù)比較發(fā)現(xiàn)了PD相關(guān)變化(包括溶酶體蛋白)有大量重疊,這為提高PD發(fā)病機制的理解開辟了新途徑。
影響因子:16.988
組學(xué)技術(shù):DIA蛋白質(zhì)
實驗樣本:215個腦脊液樣本RESRUIT
實驗結(jié)果
用于腦脊液蛋白質(zhì)組分析的PD隊列概述
為了研究帕金森病如何影響患者的腦脊液并識別潛在的生物標志物,我們采用了“矩形”生物標志物發(fā)現(xiàn)策略。研究者分析了來自兩個獨立隊列共215個個體的腦脊液樣本,包括113名健康對照(HC)和102名PD患者(第一個隊列稱HBS隊列、第二個隊列稱LCC隊列)。
腦脊液樣品的蛋白質(zhì)組學(xué)特征
研究者開發(fā)了一個穩(wěn)健、自動化和高通量的基于質(zhì)譜的蛋白質(zhì)組學(xué)工作流程,使用數(shù)據(jù)獨立采集(DIA)策略進行蛋白質(zhì)組分析(圖 1A)。該策略先前已取得了前所未有的深度,并揭示了多個獨立的阿爾茨海默病隊列中具有生物學(xué)意義的蛋白質(zhì)組變化。研究者應(yīng)用他們自己的工作流程,探究無論患者是否存在LRRK2中與疾病相關(guān)的G2019S突變。為了最大限度提高蛋白質(zhì)檢測的深度和覆蓋率,研究者通過合并三個庫生成了特定于隊列的混合光譜庫(圖1B)。在超過70%的樣本中分別量化了1290個(HBS)和1440個(LCC)蛋白質(zhì)組(圖1C、D)。量化的蛋白質(zhì)強度跨越了四個數(shù)量級(圖1E、1F)。僅前10個最豐富的蛋白質(zhì)就貢獻了約38%的總CSF蛋白質(zhì)組信號,說明了分析的挑戰(zhàn)(圖1E和1F)。
根據(jù)人類蛋白圖譜(HPA)注釋,研究者進一步將已鑒定的蛋白分類為細胞、細胞內(nèi)或細胞膜分泌的蛋白質(zhì)(許多蛋白質(zhì)被多次分配)。總的來說,94%的已鑒定蛋白至少攜帶一個注釋,其中36%為分泌蛋白,70%為細胞內(nèi)蛋白,36%為跨膜蛋白。此外,大多數(shù)定量蛋白被注釋為在大腦和肝臟中富集,這與腦脊液是中樞神經(jīng)系統(tǒng)的細胞外液的事實相一致。綜上所述,通過使用較小的腦脊液體積,我們單次分析獲得了非常高的腦脊液蛋白質(zhì)組覆蓋率,從而為發(fā)現(xiàn)PD中的生物標志物提供基礎(chǔ)。
圖 1
定量精度和樣品質(zhì)量的評估
研究者為了評估數(shù)據(jù)的定量精度,通過重復(fù)測量合并的腦脊液樣本,研究自動化工作流程的內(nèi)部和分析間的變異性。分析顯示,13%的內(nèi)部板塊變異系數(shù)和19%的板塊間變異系數(shù)(CV)的高技術(shù)重現(xiàn)性。大約1100人的檢測間和檢測內(nèi)CV低于20%,1500人低于50%(圖1G)。受試者之間的個體間生物變異性要大得多,所有蛋白質(zhì)中只有10%的CV低于20%(圖1G)。這表明檢測方法的技術(shù)變異性比生物學(xué)變異性小得多,這是成功發(fā)現(xiàn)CSF中PD特異性蛋白質(zhì)組特征和潛在生物標記物的重要前提條件。
不一致的樣本收集和處理可能會導(dǎo)致系統(tǒng)性偏差并阻礙真正的生物標記物的發(fā)現(xiàn)。為了確保腦脊液蛋白的定量變化是由于疾病相關(guān)的病理改變,研究者根據(jù)先前建立的凝固相關(guān)蛋白、血小板和紅細胞的質(zhì)量標記模型來評估所有樣本的質(zhì)量,以確定在分析前處理中是否存在潛在問題的樣本(圖2A、2B)。
結(jié)果表明:紅細胞特異性標記的污染程度在樣本間有很高的變異性,可能是由于與血液穿刺相關(guān)的污染(圖2A、2B)。研究者從HBS隊列中標記了14個樣本(8個PD, 6個HC),從LCC隊列中標記了17個樣本(4個PD, 13個HC)的紅細胞污染,并將其從進一步分析中刪除(圖2C和2D)。共有182個受試者的蛋白質(zhì)組數(shù)據(jù)符合質(zhì)量標準并被用于統(tǒng)計分析。研究者發(fā)現(xiàn)紅細胞計數(shù)和腦脊液中紅細胞特異性蛋白的數(shù)量之間沒有相關(guān)性(圖2E)。
研究者還進一步排除了來自 HBS隊列的單個樣本,該樣本在主成分分析(PCA)中遠離其他樣本聚集,而LCC隊列中的單個樣本在蛋白質(zhì)組深度上是異常值。我們隨后通過生物信息學(xué)分析來自 HBS隊列的 79 個樣本和來自 LCC 隊列的 103 個樣本,以確定疾病表現(xiàn)和 LRRK2 突變狀態(tài)對 CSF 蛋白質(zhì)組的影響。
圖 2
PD患者腦脊液和基于機械學(xué)習(xí)的對照組分類中PD相關(guān)蛋白質(zhì)組改變
為了研究PD患者與對照組相比腦脊液蛋白質(zhì)組的改變,研究者進行了ANCOVA分析,將年齡、性別和 LRRK2 突變狀態(tài)視為混雜因素。在5%的錯誤發(fā)現(xiàn)率(FDR)下,與HBS對照組相比,在HBS隊列PD患者的腦脊液中發(fā)現(xiàn)了三種顯著調(diào)控蛋白(CPM、OMD和RFNG);與LCC對照組相比,在LCC隊列PD患者中發(fā)現(xiàn)了一種(PRCP)(圖3A)。
PD患者的骨調(diào)節(jié)蛋白(OMD)和細胞表面標記蛋白(CD44)蛋白水平均顯著升高(圖3B-3E)。隨后研究者進行了GO富集分析。結(jié)果表明:與對照組相比,PD樣品中升高的蛋白質(zhì)在溶酶體相關(guān)功能上富集(圖3F)。
由于在兩組人群中都存在(但數(shù)量很少)共同改變的蛋白質(zhì),研究者使用最近引入的開源工具OmicLearn測試了機器學(xué)習(xí)(ML)如何區(qū)分PD患者和對照組。在每次訓(xùn)練迭代中選擇35個最具識別力的用于訓(xùn)練模型的蛋白質(zhì),分類器根據(jù)它們的特征重要性對它們進行排序(圖3G)。其中催乳素是50次訓(xùn)練迭代中最重要的特征。當使用這些特征來訓(xùn)練XGBoost時并基于集成樹的模型和交叉驗證方案,ROC曲線的平均曲線下面積(AUC)為0.72±0.08。
AUC是分類模型性能的常用度量,范圍包括0(所有預(yù)測都是錯誤的)到1(所有預(yù)測都是正確的)。敏感性(即正確分類PD患者的比率)和特異性(即正確分類PD陰性個體的比率)分別為67%和66%(圖3H)。綜上所述,研究者的CSF蛋白質(zhì)組數(shù)據(jù)與ML算法相結(jié)合,可以對疾病狀態(tài)進行分類。更重要的是確定了幾種有前景的PD相關(guān)蛋白,為未來的研究開辟了新的線索。
致病性LRRK2 G2019S突變對腦脊液蛋白組的影響
由于LCC隊列中有大量攜帶LRRK2 G2019S突變的受試者,研究者探索了LRRK2突變狀態(tài)是否會改變腦脊液蛋白質(zhì)組。我們再次采用性別、樣本收集年齡、研究中心和PD狀態(tài)作為混雜因素。在FDR為5%時,突變顯著改變了HLADRA、HLA-DRB1、HLA-DPA1、CTSS、PLD4、TKT、ITGB2、PRDX3、ITIH5、CNDP1和FAH蛋白的豐度(圖4A)。根據(jù)樣品中鑒定的肽段,我們可以區(qū)分兩種HLA-DRB1蛋白,這兩種蛋白都在LRRK2 G0219S載體中顯著富集。此外,F(xiàn)DR為5%的T檢驗直觀地證實了突變攜帶者中HLA-DRA、HLA-DRB1和HLA-DPA1的上調(diào)(圖4a和4B)。這些 HLA 蛋白以及 PLD4 和 CTSS 在在 PD 患者中顯著升高(>1.7倍;圖 4B-4D)。在整體范圍內(nèi)使用這種方法觀察到與野生型(WT)等位基因攜帶者相比,LRRK2 G2019S攜帶者的CSF蛋白質(zhì)組中升高的蛋白質(zhì)富含與免疫和炎癥反應(yīng)相關(guān)的類別,進一步支持了炎癥反應(yīng)增強與PD之間密切關(guān)聯(lián)的實質(zhì)性證據(jù)(圖4E)。
此外,對健康個體的非表現(xiàn)性LRRK2攜帶者(NMCs)的分析也顯示出在致病性LRRK2攜帶者中,一些HLA分子CTSS以及ADAM10和FAM234A(ITFG3)表達上調(diào),其中HLA-DRB1是唯一在FDR為5%時鑒定到顯著性水平的蛋白。與健康個體相比,致病性LRRK2攜帶者發(fā)生PD的可能性更高;因此,該分析中鑒定的蛋白質(zhì)可能包括預(yù)后因素。研究者最近在兩個獨立隊列中發(fā)現(xiàn),多個組織蛋白酶家族包括組織蛋白酶A、B、C、D、H、L、O、S和Z的水平在LRRK2 G2019S攜帶者的尿液中顯著增加。研究者也在腦脊液中檢測到這些組織蛋白酶,但與尿液相比,只有組織蛋白酶S(CTSS)受突變狀態(tài)的顯著影響(圖4F)。
腦脊液和尿液蛋白質(zhì)組的整合
研究者在其之前的研究中分析了來自兩個獨立的橫向隊列(Columbia和LCC)的235個尿液樣本,包括兩種類型的對照組、健康人群、LRRK2 G2019S攜帶者、LRRK2 G2019S突變和無LRRK2 G2019S突變的PD患者,共量化了2365個尿蛋白。隨后研究者整合了尿液和腦脊液蛋白質(zhì)組來確定共同調(diào)節(jié)的蛋白。
結(jié)果顯示:超過1000個重疊蛋白質(zhì),相當于兩種生物流體中所有已識別蛋白質(zhì)的36%(圖5A)。匹配共同的蛋白質(zhì)豐度揭示了兩種生物液體之間的明確相關(guān)性(圖5 B)。兩種液體中最豐富的蛋白包括ALB,PTGDS,ORM1,SERPINA1,B2M,以及幾種載脂蛋白和免疫球蛋白(圖5B)。
此外,F(xiàn)ischer對與尿液或腦脊液中特異性發(fā)現(xiàn)的蛋白質(zhì)或其共同重疊相關(guān)的GO術(shù)語的精確測試與兩種體液中鑒定的所有蛋白質(zhì)相比顯著豐富(圖5C)。
與對照組相比,將PD患者CSF(HBS和LCC)和尿液(Columbia)中量化的所有常見蛋白質(zhì)的ANCOVA q值與對照相關(guān),表明兩種液體中的幾種蛋白質(zhì)受到調(diào)節(jié)(圖5D-E)。
其中包括骨調(diào)節(jié)蛋白(OMD),其水平在PD患者的尿液中也顯著升高,平均倍數(shù)變化為1.47(圖5F)。接下來,研究者將LCC隊列的CSF樣本和Columbia或LCC隊列的尿液樣本中定量的所有常見蛋白的LRRK2 G2019S與LRRK2 WT進行整合(圖5G和5H)。結(jié)果顯示,在兩種基質(zhì)中以LRRK2狀態(tài)依賴性方式調(diào)節(jié)組織蛋白酶S(圖5G-H)。
與LRRK2 WT攜帶者相比,LRRK2 G2019S攜帶者CSF中的組織蛋白酶S水平更高,Columbia和LCC隊列的平均倍數(shù)變化分別為1.31(p值為0.0619)和1.65(p值為0.0001574)(圖5I)。
腦脊液蛋白質(zhì)組與指示疾病嚴重程度的臨床評分的相關(guān)性
接下來,研究者研究了HBS隊列中的蛋白質(zhì)水平變化是否與統(tǒng)一帕金森病評定量表(UPDRS)評估的PD病理學(xué)嚴重程度相關(guān)(圖6)。研究者發(fā)現(xiàn),在特發(fā)性PD患者中,有27個蛋白與UPDRS評分顯著相關(guān)(p < 0.001;圖6A)。
PD患者中最高正相關(guān)的蛋白包括CHST6(=1.6E-5和皮爾遜相關(guān)性= 0.72)、MIF(=1.8E-5和= 0.67)、LYVE1(=4.8E-5和= 0.64)、EFNA1(=5E-5和= 0.64)和ADM(=1.3E-4和= 0.61;圖6A)。PD患者中最負相關(guān)的蛋白包括POMGNT1(p = 4.6E-5和=0.64)、TMEM132A(p = 5.7E-5和=0.63)、ADAM22(p = 8.8E-5和=0.62)、PAM(p = 1.9E-4和r=0.6)和ST6GAL2(p = 2.7E-5和=0.59;Figure 6A)。有趣的是,與對照組相比,這些蛋白質(zhì)在PD病例中沒有顯著改變。然而,ADM是與簡易精神狀態(tài)檢查(MMSE)評分(p=9.3E-5;r=-0.43;認知障礙的定量測量)負相關(guān)最強的蛋白。值得注意的是,在樣本采集時沒有人出現(xiàn)嚴重癡呆或認知障礙(PD平均得分28.3,對照組平均得分28.4)。
此外,研究者還將腦脊液蛋白的相關(guān)性評分與之前在尿液中獲得的研究結(jié)果進行了比較。UPDRS III評分(尿液唯一可用評分)的皮爾遜系數(shù)比較顯示:10種蛋白質(zhì)(APOF、MAN2B2、LYVE1、APLP1、ALDOA、IGF2、SUSD5、CD99、S100A7和VGF)的系數(shù)均高于0.4或低于0.4(圖6B)。其中,VGF與兩個數(shù)據(jù)集中的UPDRS III評分呈顯著負相關(guān)(尿液和腦脊液中的分別為p=2.8E-3和7.6E-3;圖6C)?傊,該分析表明通過運動功能評估的PD患者的疾病進展會影響CSF和尿液中的一組類似蛋白質(zhì)。
在LCC隊列中,可以獲得所有受試者的蒙特利爾認知評估(MoCA)分數(shù)。有趣的是,研究者發(fā)現(xiàn)CHIT1與所有患者的MoCA評分顯負相關(guān)(在所有受試者中p=1.6E-5和r=0.48;圖S5D),而這種相關(guān)性在PD患者中更顯著(在PD患者中p=1.9E-9和r=0.81;圖S5E)。在腦脊液中,與MoCA評分呈強正相關(guān)的兩個蛋白,RELN和PENK,與年齡呈負相關(guān)。因此,腦脊液蛋白質(zhì)組中的多種蛋白質(zhì)與疾病的嚴重程度和疾病的不同臨床重要方面密切相關(guān)。
文章小結(jié)
研究者應(yīng)用了一個高度可復(fù)制、可擴展的基于MS的蛋白質(zhì)組學(xué)工作流程來對PD患者的腦脊液進行蛋白質(zhì)組分析。相比于對照組,在PD患者中可以顯著觀察到蛋白質(zhì)組的變化,并確定了LRRK2、G2019S攜帶者特異性的生物標志物。當然研究者還需要分析更大的患者隊列進行進一步的研究,去發(fā)現(xiàn)更多潛在的生物標志物。接下來研究者需要開發(fā)臨床和靶向分析來驗證生物標志物,然后在臨床常規(guī)中使用一種測試,以實現(xiàn)早期疾病檢測和患者分層。