cfDNA甲基化組多模式分析早期檢測食管鱗狀細(xì)胞癌和癌前病變
瀏覽次數(shù):586 發(fā)布日期:2024-5-9
來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
食管癌(EC)是最常見的胃腸道惡性腫瘤之一,食管鱗狀細(xì)胞癌(ESCC)是EC的主要組織學(xué)亞型,約占新EC病例的88%,大多數(shù)發(fā)生在東亞和中亞。與晚期ESCC的預(yù)后極差相比,早期ESCC(如黏膜內(nèi)ESCC)和前體病變(如上皮內(nèi)瘤變,IEN)可以通過內(nèi)鏡下整塊切除術(shù)實現(xiàn)近100%的五年疾病特異性生存率,從而無需系統(tǒng)性治療。因此檢測早期食管鱗狀細(xì)胞癌(ESCC)和癌前病變對于提高生存率至關(guān)重要。
液體活檢能夠檢測血漿中游離細(xì)胞DNA(cfDNA)內(nèi)的循環(huán)腫瘤DNA(ctDNA),為非侵入性早期癌癥檢測提供了希望。然而關(guān)于液體活檢在ESCC診斷中應(yīng)用的研究還很少。在最近對循環(huán)游離細(xì)胞基因組圖譜(CCGA)中cfDNA的多組學(xué)分析中,全基因組cfDNA甲基化成為癌癥檢測最有希望的信號,優(yōu)于片段化標(biāo)記和基因突變(如拷貝數(shù)變異,CNV)。然而,基于甲基化的ctDNA檢測方法仍存在一些挑戰(zhàn)。
中國醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院劉芝華團(tuán)隊、陳洪巖團(tuán)隊和溫州醫(yī)科大學(xué)眼科醫(yī)院甌江實驗室蘇建忠團(tuán)隊合作對來自230名非轉(zhuǎn)移性ESCC或癌前病變患者和230名來自多個中心的匹配健康對照(HC)的共460個cfDNA樣本進(jìn)行了全基因組重亞硫酸鹽測序(WGBS)。并開發(fā)了一種擴(kuò)展多模式分析(expanded multimodal analysis,EMMA)綜合方法,可以同時鑒定cfDNA WGBS數(shù)據(jù)中的cfDNA甲基化、拷貝數(shù)變異(CNV)和片段化標(biāo)記。cfDNA甲基化標(biāo)記是最早期和最敏感,可在70%的ESCC和50%的癌前病變中檢測到,并與分子亞型和腫瘤微環(huán)境相關(guān)。CNV和片段化標(biāo)記表現(xiàn)出高特異性,但與晚期疾病有關(guān)。EMMA方法顯著提高了檢出率,將AUC(area under the curve)從0.90增加到0.99,并在驗證隊列中檢測到87%的ESCC和62%的癌前病變,特異性>95%。研究通過多模式分析方法分析了cfDNA-WGBS數(shù)據(jù),揭示了cfDNA甲基化組的多模式分析對于早期檢測和監(jiān)測ESCC分子特征的潛力。相關(guān)研究成果于2024年5月2日以“Multimodal analysis of cfDNA methylomes for early detecting esophageal squamous cell carcinoma and precancerous lesions”為題發(fā)表在《Nature Communications》(IF 16.6/Q1)期刊上。
cfDNA全基因組重亞硫酸鹽測序中的EMMA framework
為加強(qiáng)ESCC的早期檢測,研究人員基于“組織-cfDNA-組織”策略開發(fā)了EMMA framework方法(圖1a)。從配對的WGBS和原發(fā)性腫瘤的全基因組測序(WGS)數(shù)據(jù)中鑒定出ESCC的DMR和CNV,并從之前的隊列ESCC基因組和表觀基因組圖譜(ECGEA)中匹配了155例ESCC病例的鄰近癌旁組織。隨后分析了cfDNA WGBS數(shù)據(jù)中ESCC的DMR和CNV;谀[瘤細(xì)胞的片段比正常細(xì)胞的片段更短,研究人員進(jìn)一步計算了短cfDNA片段大小的比例作為cfDNA-WGBS數(shù)據(jù)中的片段大小比(FSR)。接下來使用包含150名ESCC患者和150名匹配的HC的數(shù)據(jù)集,采用隨機(jī)森林的機(jī)器學(xué)習(xí)方法,利用DMR、DMR與CNV、所有三個功能(DMR、CNV和FSR),在外部ESCC隊列和癌前隊列中獨立評估每種診斷模型的性能。此外將最佳DMR與成對ESCC組織樣品中基于多組學(xué)的整合分子亞型、腫瘤微環(huán)境(TME)、存活率和轉(zhuǎn)錄組學(xué)圖譜進(jìn)行關(guān)聯(lián)分析。
研究設(shè)計了不同的隊列,包括來自中國醫(yī)學(xué)科學(xué)院癌癥醫(yī)院和中國北京協(xié)和醫(yī)學(xué)院的150名未經(jīng)治療的ESCC或食管高度上皮內(nèi)瘤變患者(HGIEN,即0期ESCC)(CHCAMS,發(fā)現(xiàn)/訓(xùn)練隊列),來自上海胸科醫(yī)院的30名未經(jīng)治療的ESCC患者(外部驗證隊列),來自CHCAMS的50名食管IEN患者(癌前驗證隊列)和230名HC,每位患者的年齡和性別在各自的隊列中相匹配(圖1b)。在進(jìn)行任何醫(yī)療干預(yù)之前,研究人員從每位受試者(n=460)中位數(shù)收集2mL血漿。ESCC患者和對照組cfDNA濃度一致。WGBS用于評估每位受試者的cfDNA甲基化組,460個cfDNA樣品占參考基因組的約89%覆蓋率,平均深度為9.51X。
圖1:研究設(shè)計和患者入組。
a. 使用機(jī)器學(xué)習(xí)開發(fā)了EMMA多模式分析方法,以加強(qiáng)血漿樣品cfDNA中ctDNA的檢測。該方法通過全面分析cfDNA全基因組亞硫酸鹽測序(cfWGBS)數(shù)據(jù)中癌癥來源的差異甲基化區(qū)域(DMR)、拷貝數(shù)變異(CNV)和片段化標(biāo)記。最初從155例食管鱗狀細(xì)胞癌(ESCC)患者的原發(fā)性腫瘤和匹配的相鄰癌旁組織的配對WGBS數(shù)據(jù)和WGS數(shù)據(jù)中鑒定出癌癥來源的DMR和CNV。隨后在cfWGBS數(shù)據(jù)中分析了ESCC來源的DMR和CNV,并進(jìn)一步利用短cfDNA片段大小比例來訓(xùn)練發(fā)現(xiàn)隊列中的診斷模型。在外部ESCC隊列和癌前隊列中獨立評估了每種診斷模型的性能。為了揭示這些最佳DMR的生物學(xué)意義,研究人員將它們與成對ESCC組織樣品中基于多組學(xué)的分子亞型和轉(zhuǎn)錄組學(xué)譜相關(guān)聯(lián)。
b. 該發(fā)現(xiàn)隊列包括150名ESCC或高級別上皮內(nèi)瘤變患者和150名匹配的健康對照,以使用不同的cfDNA特征構(gòu)建診斷模型。在外部ESCC隊列和癌前隊列中獨立評估每個診斷模型的性能。
ESCC:食管鱗狀細(xì)胞癌,IEN:上皮內(nèi)瘤變,WGS:全基因組測序,WGBS:全基因組亞硫酸鹽測序,cfWGBS:cfDNA WGBS,RNAseq:RNA測序,HC:健康對照,CNV:拷貝數(shù)變異,DMR:差異甲基化區(qū)域,IM:免疫調(diào)節(jié),CCA:細(xì)胞周期通路激活,IS:免疫抑制,NRFA:NRF2致癌激活。
cfDNA甲基化標(biāo)記物的鑒定和性能
圖2:食管鱗狀細(xì)胞癌的游離DNA甲基化標(biāo)志物及其性能檢測。
a. 在食管鱗狀細(xì)胞癌(ESCC)組織中發(fā)現(xiàn)的差異甲基化區(qū)域(DMRs)中,通過調(diào)整后的p值<0.05(雙側(cè)Wilcoxon檢驗)recall了650個DMRs,這些DMRs在發(fā)現(xiàn)隊列中的ESCC平均值(n=150)比健康對照組(n=150)更為顯著。圖中展示了前十個DMRs的惡性比例和p值。數(shù)據(jù)以最大值和最小值的中值表示。
b. ESCC-cfMeth評分的診斷性能在發(fā)現(xiàn)隊列(十倍交叉驗證,每種顏色的曲線表示一次交叉驗證)、外部驗證隊列和癌前驗證隊列中進(jìn)行了評估。黑色曲線表示受試者ROC曲線,藍(lán)色區(qū)域表示95%置信區(qū)間(CI)。
c. 使用最佳50個標(biāo)記的cfDNA惡性比例構(gòu)建最終預(yù)測模型(ESCC-cfMeth評分)。與發(fā)現(xiàn)隊列和驗證隊列中的健康對照(HCs)相比,ESCC和上皮內(nèi)瘤變(IEN)患者的ESCC-cfMeth評分顯著更高(雙側(cè)Mann-Whitney U檢驗,p<0.01)。數(shù)據(jù)以最大值和最小值的中值表示。
d. 與健康對照組相比,不同階段的ESCC(左側(cè);n=30、9、6和 15,分別為各階段的樣本數(shù))和IENs(右側(cè);n=50、12和 38,分別為各階段的樣本數(shù))的ESCC-cfMeth評分顯著提高。數(shù)據(jù)以最大值和最小值的中值表示。
e. 在ESCC組織和配對的相鄰癌旁組織(n=155)之間的基因表達(dá)比較中,發(fā)現(xiàn)50個最佳DMRs中的功能基因表達(dá)存在差異(使用雙側(cè)Wilcoxon檢驗或t檢驗,ZNF132的p值<2.2×10^-16,LINC00680、FLT1和ID1的p值分別為1.1×10^-8、2.7×10^-14和0.078)。
cfDNA中鑒定CNV用于ESCC檢測
圖3:cfDNA全基因組亞硫酸鹽測序數(shù)據(jù)中的拷貝數(shù)變異事件的recalling和分析
a. 基于全基因組重亞硫酸鹽測序(WGBS)方法,從組織和cfDNA中recalling WGBS數(shù)據(jù)中的重復(fù)拷貝數(shù)變異(CNV)。
b. 以ECGEA隊列中的002號患者為例,在全基因組測序數(shù)據(jù)中鑒定出chr.3、chr. 5的擴(kuò)增和chr. 3、4、9、10、11、13、16、18、21的缺失,并在成對的WGBS數(shù)據(jù)中recall。
c. 150例食管鱗狀細(xì)胞癌(ESCC)患者中,153個區(qū)域的CNV事件發(fā)生率顯著高于150例健康對照組(HCs)。擴(kuò)增(紅色)和缺失(藍(lán)色)用ESCC與HCs差異的相應(yīng)調(diào)整p值(錯誤發(fā)現(xiàn)率,F(xiàn)DR)顯示(雙側(cè)t檢驗;ns,灰色;FDR<0.05,黃色;FDR<0.01,橙色;FDR<0.001,深紅色)。
d. ESCC和上皮內(nèi)瘤變(IEN)患者的CNV陽性率顯著高于發(fā)現(xiàn)隊列和驗證隊列中的HCs,并且與分期和分級呈正相關(guān)。
ESCC:食管鱗狀細(xì)胞癌,IEN:上皮內(nèi)瘤變,LGIEN:低級別IEN,HGIEN:高級別IEN,HC:健康對照,WGS:全基因組測序,WGBS:全基因組重亞硫酸鹽測序,GMM:高斯混合模型,HMM:隱馬爾可夫模型,CNV:拷貝數(shù)變異,AMPL:擴(kuò)增,DELE:缺失,ns:無顯著性,G級。
cfDNA-WGBS數(shù)據(jù)中片段大小的檢測
圖4:分析全基因組重亞硫酸鹽測序數(shù)據(jù)中的cfDNA片段大小。
a. 在發(fā)現(xiàn)隊列中分析cfDNA片段大小。食管鱗狀細(xì)胞癌(ESCC)患者和健康對照組的cfDNA peaks均為166 bp。但在ESCC中鑒定出更多的短片段(90–150bp)。
b. 以全基因組重亞硫酸鹽測序數(shù)據(jù)中的片段大小比(FSR)計算cfDNA的短片段比例。
c. 人類基因組分為5Mb bins,共產(chǎn)生1082(541個bins×2)個FSR。
d. 在發(fā)現(xiàn)隊列中,ESCC患者和HCs之間所有bins的平均FSR均無顯著差異。但83個bins中ESCC患者的FSR顯著高于發(fā)現(xiàn)隊列中HCs。發(fā)現(xiàn)隊列和外部驗證隊列中的ESCC患者中83個選定BIN的平均FSR顯著高于癌前驗證隊列中的上皮內(nèi)瘤變患者(雙側(cè)Mann–Whitney U檢驗,p < 0.05)。數(shù)據(jù)以具有最大值和最小值的中值表示。
聯(lián)合EMMA模型準(zhǔn)確檢測ESCC和癌前病變
圖5:三種cfDNA特征的互補(bǔ)性和組合模型的性能。
a. 人類基因組中cfDNA甲基化標(biāo)記、拷貝數(shù)變異和片段化標(biāo)記分布。
b. 在發(fā)現(xiàn)隊列的食管鱗狀細(xì)胞癌(ESCC)患者中發(fā)現(xiàn)了這三個標(biāo)記之間的互補(bǔ)性。每個條形圖表示ESCC患者中每個標(biāo)記的狀態(tài)。
c. 在外部驗證隊列和癌前驗證隊列中評估ESCC-cfMeth評分、DMR加CNV模型、和EMMA模型的診斷性能。
d. ESCC-cfMeth評分、DMR加CNV模型、和EMMA模型對上皮內(nèi)瘤變(IEN)I、II和III期ESCC的檢出率。
e. 在外部驗證隊列中,三個標(biāo)記的互補(bǔ)性提高了組合模型的性能。
f. 根據(jù)不同的實驗間隔,從5年到連續(xù)測試(理想化),評估EMMA模型和ESCC-cfMeth模型的潛在生存效益。
g. 不同cfDNA標(biāo)記和組合模型的檢出率以及不同階段的5年生存率示意圖。
cfDNA甲基化標(biāo)記的生物學(xué)意義
圖6:DNA甲基化標(biāo)記在食管鱗狀細(xì)胞癌cfDNA中的生物學(xué)意義
a. 根據(jù)ESCC-cfMeth評分中50個最佳DNA甲基化標(biāo)記的平均甲基化水平,將ECGEA隊列中的155例食管鱗狀細(xì)胞癌(ESCC)患者分為三組。
b. ESCC分子亞型在甲基化顯著組(methylation-dominate)(n=69)、甲基化中度組(methylation-moderate)(n=54)和甲基化缺失組(methylation-poor)(n=32)中的比例。
c. 通過雙側(cè)t檢驗對甲基化顯著組(n=69)和甲基化中度組/甲基化缺失組(n=86)比較分析腫瘤微環(huán)境中的細(xì)胞組分。(p=6.6×10-3、0.04、0.01、0.04和0.04分別用于上皮細(xì)胞、CD4+T細(xì)胞、CD8+T細(xì)胞、B細(xì)胞和樹突狀細(xì)胞)。
d. 這些通路在甲基化顯著組和甲基化缺失組中富集。
研究小結(jié):
本研究分析了循環(huán)游離DNA(cfDNA)中鑒定出的最佳甲基化標(biāo)記的生物學(xué)意義。研究首先從大量配對的食管鱗狀細(xì)胞癌(ESCC)組織樣本中獲得的全基因組亞硫酸鹽測序(WGBS)數(shù)據(jù)中鑒定了差異甲基化區(qū)域(DMRs),并通過與多種細(xì)胞類型的比較驗證其特異性。在這些DMRs中發(fā)現(xiàn)了與ESCC相關(guān)且表達(dá)顯著不同的已知功能基因。隨后根據(jù)最佳DMRs的甲基化水平將ESCC患者分為三組。甲基化顯著組表現(xiàn)出更高的CCA亞型和上皮細(xì)胞組分患病率,這也與更好的存活率相關(guān)。相比之下,腫瘤微環(huán)境(TME)的分析和差異表達(dá)顯示,免疫細(xì)胞的升高和免疫過程的增強(qiáng)可能會減少與ESCC相關(guān)甲基化標(biāo)記信號。甲基化中等組和甲基化缺失組屬于IM亞型的ESCC患者比例較高。這一亞型對免疫療法的靈敏度高于其他ESCC亞型,表明cfDNA檢測在預(yù)測和監(jiān)測免疫療法反應(yīng)方面的潛力?傮w而言,本研究為cfDNA甲基化標(biāo)記的生物學(xué)和臨床意義提供了全面的見解,并提供了一種用于動態(tài)監(jiān)測ESCC分子特征的非侵入性工具。
同時本研究有幾個局限性:
a)盡管分析了1000多個全基因組數(shù)據(jù)集,但本研究驗證隊列相對較小。
b)這些多模式標(biāo)記的潛在功能仍然未知,尤其是在癌前病變中。
c)本研究是以成本效益高且節(jié)省樣本的方式從WGBS數(shù)據(jù)中獲得了拷貝數(shù)變異(CNVs)和片段化標(biāo)記,但在WGBS中的亞硫酸鹽轉(zhuǎn)化過程中,一些cfDNA片段可能會受損,與直接從cfDNA WGS數(shù)據(jù)相比,可能會削弱CNVs和片段化標(biāo)記的信號。
d)由于在WGBS數(shù)據(jù)中突變calling的不可靠性,本多模式模型中未納入突變。使用其他方法準(zhǔn)確鑒定TP53等基因突變可能會進(jìn)一步提高ESCC的檢出率。
e)ESCC-cfDNA和EMMA模型的生存效益和預(yù)后意義需要在大規(guī)模真實世界隊列中進(jìn)一步驗證。
總之,本研究通過多模式方法對液體活檢中的cfDNA甲基化、CNV和片段化標(biāo)記進(jìn)行了全面分析,以實現(xiàn)ESCC的超早期檢測。通過多模式方法分析cfDNA WGBS數(shù)據(jù)鑒定了幾種分期特異性標(biāo)記及其互補(bǔ)性。研究不僅顯著提高了ESCC的非侵入性檢測能力,而且還具有動態(tài)分子監(jiān)測和治療指導(dǎo)的潛力。
參考文獻(xiàn):
Liu J, Dai L, Wang Q, Li C, Liu Z, Gong T, Xu H, Jia Z, Sun W, Wang X, Lu M, Shang T, Zhao N, Cai J, Li Z, Chen H, Su J, Liu Z. Multimodal analysis of cfDNA methylomes for early detecting esophageal squamous cell carcinoma and precancerous lesions. Nat Commun. 2024 May 2;15(1):3700. pii: 10.1038/s41467-024-47886-1. doi: 10.1038/s41467-024-47886-1. PubMed PMID: 38697989.