百趣代謝組學(xué)文獻(xiàn)分享,結(jié)直腸癌(Colorectal cancer, CRC)為癌癥死亡率第二的疾病,其發(fā)病率一直處于上升趨勢,可能與生活方式和環(huán)境因素的改變相關(guān)。近年來,生活方式和環(huán)境因素對腸道菌群影響的研究被不斷報(bào)道,且發(fā)現(xiàn)了腸道菌群在CRC中的改變,但是功能方面的研究仍缺乏,也沒有基于“多界”微生態(tài)的系統(tǒng)研究。
上海交通大學(xué)醫(yī)學(xué)院王慧教授與同濟(jì)大學(xué)朱瑞新教授、中科院上海營養(yǎng)與健康研究所張國慶教授、復(fù)旦大學(xué)陳興棟教授、中山大學(xué)附屬第六醫(yī)院朱立新教授團(tuán)隊(duì)合作,在Nature Microbiology(IF=30.964)上發(fā)表了題為“Multi-kingdom microbiota analyses identify bacterial–fungal interactions and biomarkers of colorectal cancer across cohorts”的研究成果。
圖1. 人群隊(duì)列分布
代謝組學(xué)分享—結(jié)果
1.與CRC相關(guān)的菌變化
結(jié)合MMUPHin和PERMANOVA分析發(fā)現(xiàn) ,CRC人群的α多樣性顯著降低;β多樣性表明菌群的組成不僅與疾病有關(guān),在不同人群間也有顯著差異。代謝組學(xué)文獻(xiàn)分享,對不同人群物種組成的MaAsline2分析發(fā)現(xiàn)與CRC相關(guān)各界菌的變化,同時(shí)也發(fā)現(xiàn)部分差異細(xì)菌(如Alistipes onderdonkii, Parvimonas micra和Gemella morbillorum)和差異真菌(如Aspergillus rambellii和Trichophyton mentagrophytes)穩(wěn)定存在于5個(gè)發(fā)現(xiàn)數(shù)據(jù)中,也有部分古菌和病毒在不同數(shù)據(jù)集中存在明顯差異。
代謝組學(xué)文獻(xiàn)分享,之后發(fā)現(xiàn)在CRC人群和對照人群中有顯著差異的88個(gè)細(xì)菌、108個(gè)真菌、38個(gè)古菌和115個(gè)病毒,其中有48個(gè)已報(bào)道過的細(xì)菌在CRC中升高(如F.nucleatum,P. micra, Porphyromonas asaccharolytica, Desulfovibrio desulfuricans和Akkermansia muciniphila),有益的產(chǎn)乳酸菌在CRC中降低(Clostridium butyricum和Roseburia intestinalis等)。
圖2. 微生物多樣性和差異組成結(jié)果
進(jìn)一步的機(jī)器學(xué)習(xí)算法選出與CRC相關(guān)的重要菌(27個(gè)細(xì)菌,20個(gè)真菌,20個(gè)古菌和21個(gè)病毒);代謝組學(xué)文獻(xiàn)分享,建立的隨機(jī)森林模型發(fā)現(xiàn),細(xì)菌panel對CRC的診斷能力最強(qiáng)(平均AUROC=0.80),其次為真菌(平均AUROC=0.77),古菌(平均AUROC=0.74)和病毒(平均AUROC=0.73);為探討基于各界panel建立的模型在不同數(shù)據(jù)集間的穩(wěn)定性,又進(jìn)行了cohort-to-cohort transfer和leave-one-cohort-out分析,進(jìn)一步證實(shí)了建立模型的有效性。
圖3. 基于單界微生態(tài)的差異菌和模型結(jié)果
隨后又分別建立two-kingdom, three-kingdom和four-kingdom 微生物的multi-kingdom組合模型,發(fā)現(xiàn)multi-kingdom模型的診斷準(zhǔn)確率優(yōu)于single-kingdom模型,代謝組學(xué)文獻(xiàn)分享,其中有細(xì)菌和真菌features的模型效果更好,并通過four-kingdom微生物組合模型確定了前20個(gè)最重要的features (13個(gè)細(xì)菌,5個(gè)真菌,1個(gè)古菌和1個(gè)病毒)。代謝組學(xué)文獻(xiàn)分享,為進(jìn)一步縮小核心菌群,通過隨機(jī)森林確定了包含11種細(xì)菌、4種真菌和1種古菌在內(nèi)的16個(gè)features的multi-kingdom模型,該模型在不同隊(duì)列中均表現(xiàn)出較好的診斷效果(AUROC>0.82, 日本隊(duì)列中AUROC=0.73),在德國隊(duì)列中的AUROC高達(dá)0.92。此外,該模型也可用于CRC的早期診斷(AUROC=0.78)。
代謝組學(xué)文獻(xiàn)分享,接著又用3個(gè)數(shù)據(jù)集(中國,奧地利和美國)對16個(gè)features的multi-kingdom模型進(jìn)行驗(yàn)證,發(fā)現(xiàn)模型在中國和奧地利隊(duì)列中的AUROC分別為0.88和0.81,而在美國隊(duì)列中的AUROC為0.68,可能與該隊(duì)列樣本保存時(shí)間過長(>25年)有關(guān)。
代謝組學(xué)文獻(xiàn)分享,為驗(yàn)證模型的特異性,又納入IBD(inflammatory bowel disease),T2D(type 2 diabetes)和PD(Parkinson’s disease)三種疾病的數(shù)據(jù)集進(jìn)行驗(yàn)證,結(jié)果發(fā)現(xiàn)模型的準(zhǔn)確性大大降低,從而表明該模型在CRC診斷方面表現(xiàn)出有較高的特異性。
圖4. Multi-kingdom模型結(jié)果
代謝組學(xué)文獻(xiàn)分享,為進(jìn)一步探究各菌間的相關(guān)性,基于各菌的豐度進(jìn)行了co-abundance相關(guān)性分析,菌在CRC組中有更多的關(guān)聯(lián),其中除了kingdom內(nèi)顯著的關(guān)聯(lián)外,還發(fā)現(xiàn)了kingdom間(特別是細(xì)菌-真菌)的顯著關(guān)聯(lián)。
圖5. 相關(guān)性結(jié)果
2.微生物介導(dǎo)的功能變化和相關(guān)基因驗(yàn)證
為進(jìn)一步探索微生物介導(dǎo)的功能變化,基于KEGG進(jìn)行KO和pathway水平的功能分析,發(fā)現(xiàn)了1,053個(gè)差異KO基因和49個(gè)差異pathways,與碳水化合物代謝相關(guān)的pathways(如:丁酸,抗壞血酸和醛酸代謝)和與氨基酸代謝相關(guān)的pathways(D-精氨酸和D-鳥氨酸代謝)在CRC中升高,支鏈氨基酸和脂質(zhì)代謝相關(guān)的pathways在CRC中減低;通過HAlla分析也發(fā)現(xiàn)了不同代謝通路與菌有一定的相關(guān)性。
對與D-精氨酸,D-鳥氨酸代謝相關(guān)基因oraE和oraS及與丁酸代謝相關(guān)的基因bdhA/B的PCR定量檢測分析發(fā)現(xiàn),在CRC中這幾個(gè)基因顯著升高。
該研究還進(jìn)一步探索了multi-kingdom微生物之間的相互作用以及微生物介導(dǎo)的功能變化,發(fā)現(xiàn)了細(xì)菌-真菌相互作用通過上調(diào)D-精氨酸、D-鳥氨酸以及刺激丁酸代謝通路促進(jìn)結(jié)直腸癌發(fā)病的機(jī)制。代謝組學(xué)文獻(xiàn)分享,同時(shí),該研究還基于功能基因構(gòu)建了CRC診斷模型,也具有較高的準(zhǔn)確率(平均AUC為0.86)。最后,基于EggNOG基因、KO基因和通路水平建立模型。有趣的是,基于EggNOG基因的診斷模型的準(zhǔn)確率高達(dá)0.86,優(yōu)于菌species水平建立的模型。
圖6. 與CRC相關(guān)的功能變化和基于KO基因建立模型結(jié)果
代謝組學(xué)分享—總結(jié)
該研究是迄今為止樣本量最大、最全面的基于宏基因組測序技術(shù)對CRC腸道菌群進(jìn)行研究的多中心隊(duì)列,首次繪制了全球CRC人群隊(duì)列的“4K”微生態(tài)圖譜,建立了基于多界組合的微生物組的CRC診斷模型,驗(yàn)證了由微生物介導(dǎo)功能相關(guān)基因的變化,為結(jié)直腸癌早期診斷和預(yù)后評估及潛在的治療靶點(diǎn)提供了基于微生物及其功能標(biāo)志物的新方法和新思路。