在代謝組學結(jié)果分析中,尤其是在疾病及治療機制研究過程中,快速準確地找到差異代謝物,進而從中鎖定潛在的目標生物標志物或功能驗證代謝物至關(guān)重要。本文旨在介紹一系列技術(shù)策略和方法,以幫助研究者提高篩選效率,確保研究的準確性和可靠性。
1. 篩選差異代謝物
代謝組學差異分析是代謝組學研究中不可或缺的一環(huán),其目的在于通過比較不同組別間的代謝物表達水平,篩選出具有顯著差異的代謝物。這些差異代謝物能夠作為生物體生理或病理狀態(tài)的重要指示,為疾病的診斷、治療和預防提供有價值的線索。在代謝組差異分析中,常用的方法包括以下幾種:
1.1 多維統(tǒng)計分析
代謝組學數(shù)據(jù)具有多維性,且某些變量間可能高度相關(guān),僅運用傳統(tǒng)的單維分析無法快速、充分、準確地挖掘數(shù)據(jù)內(nèi)潛在的信息。因此對采集的多維數(shù)據(jù),一般進行如下變量分析,進而挖掘和提煉更有用的信息。
● 主成分分析(PCA):PCA是一種廣泛使用的數(shù)據(jù)降維算法,它通過找出數(shù)據(jù)矩陣的方差最大方向作為第一主成分(PC1),然后在與PC1正交的平面中找出方差最大的方向作為第二主成分(PC2),以此類推。通過這種方式,PCA可以將高維數(shù)據(jù)映射到低維空間幫助分析和概覽整個數(shù)據(jù)集,揭示數(shù)據(jù)集中的自然聚類趨勢、分組差異以及離群值。
PCA可用于尋找離群點(outlier),但對于離群點的處理需謹慎,不建議簡單粗暴地刪除,某些離群點可能是有趣且值得深究的。研究人員需要仔細地排查離群究竟是因為采樣、前處理、檢測等環(huán)節(jié)引入的誤差還是客觀的生物學差異引起的。
●偏最小二乘判別分析(PLS-DA):PLS-DA結(jié)合了降維和回歸模型,通過多元線性回歸技術(shù)找到數(shù)據(jù)集和類別標簽之間的最大協(xié)方差方向,建立潛在關(guān)聯(lián)的分析方法。
● 正交偏最小二乘判別分析(OPLS-DA): OPLS-DA根據(jù)類別Y將數(shù)據(jù)集X的差異分為兩個部分,一部分代表與Y相關(guān)的差異,另一部分代表與Y不相關(guān)的差異。OPLS-DA可以更好地區(qū)分組間差異,提高模型的有效性和解析能力。PLS-DA適用于兩組及以上組別的分類比較,而OPLS-DA通常用于兩組的對比分析。
● 置換檢驗(Permutation test):使用OPLS-DA時,存在數(shù)據(jù)過度過濾的風險,因此必須進行嚴格的統(tǒng)計驗證。置換檢驗(Permutation test)是較為常用的多維模型檢驗方式,常和Q2結(jié)合使用。其原理是將每個樣本的分組標簽隨機打亂,重新建模和預測。一個可靠模型的Q2應當顯著大于將數(shù)據(jù)隨機打亂建模后得到的Q2。基于置換檢驗的結(jié)果,可以畫出Permutation plot。該圖展示了置換檢驗得到的分組變量和原始分組變量的相關(guān)性以及對應的Q2值,虛線為回歸線。
1.2 單維統(tǒng)計分析
單維統(tǒng)計分析包括參數(shù)檢驗中的T檢驗、方差分析(ANOVA),非參數(shù)檢驗中的Mann-Whitney U檢驗、Kruskal-Wallis檢驗等方法,用于區(qū)分變量是否具有統(tǒng)計顯著性。在代謝組學中,根據(jù)數(shù)據(jù)是否服從正態(tài)分布及方差齊性,選擇對應的單維檢驗方法。通常,若某代謝物數(shù)據(jù)各組均服從正態(tài)分布以及方差齊性,用參數(shù)檢驗(兩兩比較采用T檢驗,兩組以上采用ANOVA),有一個不滿足則用非參數(shù)檢驗(兩兩比較采用Mann-Whitney U檢驗,兩組以上采用Kruskal-Wallis檢驗)。
1.3 差異代謝物篩選
差異代謝物的篩選通常會結(jié)合單維與多維統(tǒng)計分析方法。兩兩比較中的多維差異篩選通;贠PLS-DA模型,它將與分組相關(guān)的所有信息集中在第一主成分上,更易于進行模型解釋。篩選的標準通常是基于VIP (Variable importance in the projection),描述了每一個變量對模型的總體貢獻,通常設定閾值為VIP>1。單維差異篩選通;趩尉S檢驗的P值<0.05,變化倍數(shù)(FC,F(xiàn)old change),火山圖(Volcano plot)等都是常用的篩選工具。
根據(jù)差異代謝物的篩選指標,優(yōu)先關(guān)注P值越小、變化倍數(shù)越大(FC的異常大和異常。、VIP值越大的差異代謝物,對這部分代謝物進行相關(guān)生物學功能文獻調(diào)研,當生物學功能比較明確時,可以進一步選擇其他中心臨床大樣本集、相關(guān)疾病模型的動物水平樣本、細胞水平樣本等開展多水平的驗證性試驗,當顯著的差異代謝物在臨床大樣本集得到確認后可進行ROC等分析進一步篩選潛在生物標志物。
首先需要明確具體差異代謝物的功能,可用代謝物名稱在HMDB數(shù)據(jù)庫查詢了解初步的功能,再結(jié)合代謝物和功能或疾。ㄈ缥赴、IBD、動脈粥樣硬化、高血壓、阿茲海默病…)等關(guān)鍵詞搜索相關(guān)文獻進行總結(jié)。在諸多的代謝通路中根據(jù)文獻總結(jié)結(jié)果鎖定與課題最匹配的通路進行驗證性研究。
2. 代謝通路分析
通過上述方法篩選到差異代謝物后,還需要挖掘和這些代謝物相關(guān)的代謝通路。此時,可以采用MetaboAnalyst網(wǎng)站(http://www.metaboanalyst.ca/)進行代謝通路分析(Metabolic pathway analysis)繪譜君已整理完整操作教程:超實用工具 | 代謝組學MetaboAnalyst 5.0通路富集分析 ,代謝通路分析分為富集分析(Enrichment analysis)和通路分析(pathway analysis)。通路分析中添加了通路拓撲分析(topology analysis),會輸出通路在整體網(wǎng)絡中的重要性(impact)。通過差異代謝物進行通路富集分析,富集到顯著變化的代謝通路后,可以鎖定差異代謝物上下調(diào)變化及上下游代謝物,進而鎖定相關(guān)作用的酶即蛋白,驗證酶的變化情況是否與代謝物變化的相一致。
3. 機器學習算法進行建模分析
機器學習算法在代謝組學中的應用可以幫助研究者從復雜的代謝物數(shù)據(jù)中發(fā)現(xiàn)模式、識別生物標志物和理解生物學過程。通過對差異代謝物進行進一步篩選,作為進一步診斷實驗及尋找生物標志物的候選來源。
● 邏輯回歸(Logistic Regression):是一種基礎的統(tǒng)計方法,模型結(jié)構(gòu)簡單,容易理解和實現(xiàn)。它用于處理二分類問題,預測事件發(fā)生的概率。在代謝組學研究中,當目標是區(qū)分不同疾病狀態(tài)或不同生物學狀態(tài)時,常使用該方法預測新樣本屬于特定類別的概率。
● 隨機森林(Random Forest):它是一種集成學習方法,通過構(gòu)建多個決策樹并將它們的預測結(jié)果結(jié)合起來,以提高模型的準確性和穩(wěn)定性。在代謝組學中,隨機森林可以分析大量代謝物之間的關(guān)系,幫助找到與疾病、治療效果等相關(guān)的重要代謝物。它能夠處理復雜的代謝數(shù)據(jù)并提供有用的見解。
● 支持向量機(Support Vector Machine, SVM):它是一種強大的分類器,通過找到數(shù)據(jù)點之間的最優(yōu)邊界來區(qū)分不同的類別。在代謝組學中,支持向量機可以用于分類任務,比如區(qū)分健康與病態(tài)樣本。它能夠在復雜的代謝物數(shù)據(jù)中找到明顯的分類邊界,從而幫助研究人員更好地理解生物過程。
這三種方法各有優(yōu)缺點,在代謝組學中有廣泛應用。它們可以幫助研究人員從復雜的代謝數(shù)據(jù)中提取有價值的信息,識別潛在的疾病標志物。
4. 多組學數(shù)據(jù)整合分析
通過整合代謝組學、轉(zhuǎn)錄組學、蛋白質(zhì)組學、微生物組學等多組學數(shù)據(jù),可以顯著提高生物標志物篩選的準確性。具體來說,結(jié)合差異代謝物與其他組學數(shù)據(jù)(基因組、轉(zhuǎn)錄組、蛋白組、菌群16S、臨床指標)篩選到的差異基因、差異蛋白、差異菌群和臨床指標等進行關(guān)聯(lián)分析,探討它們是否能映射到相同通路,進而解釋相同的生物學功能;同時,通過建立各組學變量之間的相關(guān)性,從陽性關(guān)聯(lián)對的角度,可以驗證實驗結(jié)果,進一步探索組學間的因果關(guān)系。多組學分析能夠覆蓋生物體內(nèi)的多個層面,提供更完整的生物學信息。這種全面性有助于揭示生物體在不同條件下的分子反應和調(diào)控網(wǎng)絡,從而為疾病機理、藥物作用機制等研究提供更全面的視角。
通過上述幾種方法結(jié)合使用、多重篩選和互相驗證,即可以得到確定變化的潛在目標代謝物,進一步推進臨床和生物標志物的研究。
5. 解析差異物中鎖定目標代謝物典型案例
5.1 賈偉院士科研團隊研究案例
● Advanced Science | 代謝組+菌群揭示促進胃癌發(fā)生新機制
本文是研究某一代謝物的經(jīng)典思路:代謝組+宏基因組聚焦到結(jié)合型膽汁酸TDCA,(通過代謝物與臨床指標最強相關(guān)性的代謝物進行聚焦),后通過添加代謝物、單菌移植分別在細胞水平和小鼠水平驗證,全面揭示其作用機制。
納入健康人(n=50)、膽汁反流性胃炎患者(BRG,n=50)和胃癌患者(GC,n=45)胃液進行膽汁酸檢測,BRG和GC患者胃液結(jié)合型膽汁酸水平顯著升高。相關(guān)性分析發(fā)現(xiàn),BRG和GC患者中TDCA水平與胃液pH值的改變呈現(xiàn)最強的正相關(guān)(通過代謝物與臨床指標最強相關(guān)性的代謝物進行聚焦)。隨后開展添加代謝物、單菌移植分別在細胞水平和小鼠水平驗證實驗及機制研究,全面揭示膽汁酸和微生物在膽汁反流性胃炎、胃癌中的重要作用及分子機制:腸道菌及代謝物通過激活I(lǐng)L-6/JAK1/STAT3通路促進胃癌前病變的發(fā)生。并指出中藥丹參中的一種有效成分隱丹參酮能有效抑制膽汁反流引起的胃癌前病變。
5.2 麥特繪譜客戶研究案例
● Microbiome | 腸道菌群與代謝促進多發(fā)性骨髓瘤發(fā)病新機制
本研究是研究某一代謝物的常用思路:宏基因組+代謝組聚焦到氮循環(huán)代謝物(通過多組學策略中的宏基因組通路富集結(jié)果進行代謝物的聯(lián)系和聚焦),隨后通過糞菌移植、單菌移植以及代謝物的飲食剝奪進行干預驗證,全面揭示其作用機制。
納入19例MM患者和18例性別和年齡相匹配的健康對照組(HC)進行糞便樣本的宏基因組測序和代謝組學檢測,其中,宏基因組的通路模塊分析中氮循環(huán)的硝化和反硝化顯著富集,推測MM中的優(yōu)勢菌可能是由宿主的氮積累引起的(通過多組學策略中的宏基因組通路富集結(jié)果進行代謝物的聯(lián)系和聚焦)。隨后開展隨后通過糞菌移植、單菌移植以及代謝物的飲食剝奪進行干預驗證實驗及機制研究,全面揭示:MM患者中骨髓微環(huán)境中氨基酸異常,導致血中尿素累積,氮源循環(huán)微生物增殖;氮循環(huán)微生物致使尿素降解、谷氨酰胺從頭合成增加,從而加速宿主MM進程。提示通過干預MM患者的腸道菌群可作為MM治療的新靶標。
● Cell Discovery | 眼-腸軸新發(fā)現(xiàn):色氨酸腸菌代謝物吲哚-3-乙酸通過促進I型膠原合成抑制高度近視進展
本研究也是研究某一代謝物的常用思路:16S+代謝組發(fā)現(xiàn)吲哚-3-乙酸,3-IAA(通過單維進行篩選和聚焦)在高度近視組(HM)下降最為顯著。小鼠進行3-IAA灌胃處理、3-IAA處理人胚胎眼鞏膜成纖維細胞(HFSFs)緩解HM進展并探究機制。
納入52名HM(高度近視)患者、45名健康(HC)對照作為發(fā)現(xiàn)隊列;另外納入26名HM(高度近視)患者、23名健康(HC)對照作為驗證隊列。使用Q300全定量靶向代謝組學技術(shù)檢測血漿樣本,發(fā)現(xiàn)HM組內(nèi)的吲哚水平顯著下降,其中3-IAA下降最為顯著(通過單維進行篩選和聚焦)。且其水平的降低與HM的嚴重程度呈負相關(guān),隨后開展對3-IAA的后續(xù)驗證,全面揭示,腸道微生物來源的代謝產(chǎn)物吲哚-3-乙酸(3-IAA)通過促進I型膠原蛋白合成來抑制高度近視進展。因此這種以微生物群為中心的抗HM效應可能通過每日補充3-IAA為高度近視的干預開辟新的治療途徑。
5.3 主刊和頂刊研究案例
● Nature | 菌群代謝物3-IAA顯著提升胰腺癌化療療效
研究某一代謝物的范例:16S+代謝組發(fā)現(xiàn)吲哚-3-乙酸(通過單維進行篩選和聚焦)在免疫治療有效患者中增加。糞便菌群移植、膳食補充色氨酸和口服3-IAA增加PDAC小鼠化療療效并探究機制。最后,臨床隊列驗證3-IAA的水平和化療療效顯著相關(guān)。
招募30名mPDAC患者,其中23名未接受抗生素治療,在化療開始前收集其糞便樣本對腸道菌群進行分析。為了研究菌群與化療反應之間的潛在因果關(guān)系,將前10名招募的R和NR組的菌群轉(zhuǎn)移到無菌小鼠體內(nèi),然后注射胰腺癌KPC細胞。收集R和NR組的患者血清以及相匹配的定植小鼠的血清,進行靶向代謝組學檢測。結(jié)果顯示,與NR組相比,色氨酸代謝物吲哚-3-乙酸(3-IAA)是R組中顯著增加最多的代謝物(通過單維進行篩選和聚焦)。隨后開展對3-IAA的后續(xù)驗證。全面揭示,菌群代謝物吲哚-3-乙酸(3-IAA)與治療效果之間存在顯著相關(guān)性,并提示化療聯(lián)合特定營養(yǎng)干預或能改善PDAC(甚至其他癌癥)療效。
● Cell Metabolism | 菌群-脯氨酸代謝調(diào)控抑郁癥
本研究是多組學經(jīng)典思路:臨床隊列的代謝組+宏基因組聚焦到脯氨酸(通過代謝物與臨床指標最強相關(guān)性的代謝物進行聚焦),補充脯氨酸、糞菌移植、敲低及單菌移植在動物上驗證,全面揭示脯氨酸的腸腦軸作用機制。
首先對縱向發(fā)現(xiàn)隊列(IRONMET,n=116)的血漿和糞便樣本進行代謝組學分析,基于機器學習變量選擇策略篩選出幾種與PHQ-9評分相關(guān)的代謝物。通過另一個獨立驗證隊列(IMAGEOMICS,n=919)血漿樣本進行驗證。其中兩個隊列最一致的發(fā)現(xiàn)是,血漿脯氨酸與抑郁評分的強正相關(guān)(通過代謝物與臨床指標最強相關(guān)性的代謝物進行聚焦)。且通過食物頻率問卷對常規(guī)營養(yǎng)素、維生素、礦物質(zhì)、氨基酸和脂肪酸與發(fā)現(xiàn)隊列(IRONMET)PHQ-9評分進行分析。結(jié)果顯示,脯氨酸是對抑郁癥影響最大的因素。于是聚焦脯氨酸并開展后續(xù)驗證。全面揭示,依賴于腸道菌群的脯氨酸代謝變化對抑郁癥的影響,并提示靶向菌群/膳食脯氨酸或可有效改善抑郁。
參考文獻
1.Multivariate Analysis in Metabolomics. Curr Metabolomics. 2013.
2.Assessment of PLSDA cross validation. Metabolomics. 2008.
3.CV-ANOVA for significance testing of PLS and OPLS® models. J. Chemometrics. 2008.
4.Bile Acid–Microbiome Interaction Promotes Gastric Carcinogenesis. Advanced Science. 2022.
5.Alterations of gut microbiome accelerate multiple myeloma progression by increasing the relative abundances of nitrogen-recycling bacteria. Microbiome. 2020.
6.Gut microbiota-derived indole-3-acetic acid suppresses high myopia progression by promoting type I collagen synthesis. Cell Discovery. 2024.
7.Microbiota-derived 3-IAA influences chemotherapy efficacy in pancreatic cancer. Nature. 2023.
8.Microbiota alterations in proline metabolism impact depression. Cell Metabolism. 2022.