全基因組cfDNA甲基化分析在提高早期乳腺癌無創(chuàng)診斷成像準(zhǔn)確性的應(yīng)用
瀏覽次數(shù):479 發(fā)布日期:2023-3-28
來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
乳腺癌早期發(fā)現(xiàn)是提高患者預(yù)后和生存率的關(guān)鍵。基于乳房X線片和超聲技術(shù)的乳腺影像報告和數(shù)據(jù)系統(tǒng)(BI-RADS)被廣泛用于乳腺癌的早期診斷,但這種方法的假陽性率較高,會導(dǎo)致不必要的活檢,尤其是對于BI-RADS-4類的患者來說。而攜帶DNA甲基化信息的游離DNA(cfDNA)已經(jīng)成為一種非侵入性的癌癥檢測方法。在本文中,作者進(jìn)行了一項前瞻性多中心研究,利用全基因組重亞硫酸鹽測序數(shù)據(jù)來研究203名疑似惡性乳腺病變的女性患者cfDNA甲基化標(biāo)志物的臨床應(yīng)用。cfDNA主要富集在低甲基化的基因組區(qū)域。作者設(shè)計了一套方法來挖掘最佳的DNA甲基化標(biāo)記物,顯著提高了BI-RADS 4類患者的早期診斷率(AUC從0.78-0.79到0.93-0.94)。作者通過開展基于血液的全基因組DNA甲基化研究,以單堿基分辨率從良性腫瘤中檢測早期乳腺癌,結(jié)果表明結(jié)合液體活檢和傳統(tǒng)的成像診斷可以通過降低假陽性率和避免不必要的損害來改進(jìn)當(dāng)前乳腺癌早期診斷的臨床實踐。
方案設(shè)計
本研究收集了接受乳腺X線片和超聲檢查后活檢的210例BI-RADS 4類乳腺病變女性患者。從CHCAMS的活檢患者中收集了20個腫瘤樣本(10個惡性和10個良性),用于全基因組亞硫酸氫鹽測序(WGBS)。后續(xù)具體的研究方案如圖1所示。
圖1
主要結(jié)果
作者利用WGBS檢測了每個受試者的cfDNA甲基化組。由于ctDNA在總cfDNA中的含量較低,作者設(shè)計了一個計算框架來提高cfDNA甲基化標(biāo)志物的檢測(圖2),該框架包括基于腫瘤樣本的差異甲基化區(qū)域的識別、cfDNA富集分析、片段大小選擇、基于片段的cfDNA惡性比率的統(tǒng)計推斷以及早期乳腺癌預(yù)測模型的建立。
圖2
在文庫制備和測序后,作者通過分析WGBS數(shù)據(jù)(n=101例惡性和102例良性)預(yù)測了cfDNA長度的分布情況,結(jié)果顯示cfDNA長度分布呈現(xiàn)典型模式,在167bp處有顯著富集。cfDNA與19個組織樣本一起產(chǎn)生了總計4.0TB的WGBS數(shù)據(jù),平均覆蓋參考基因組的88%,平均深度為11.2 x。
cfDNA甲基化標(biāo)記的鑒定。研究發(fā)現(xiàn)WGBS的cfDNA片段在編碼區(qū)和基因間隔區(qū)富集,而在基因啟動子區(qū)域缺失(圖3A)。不同基因組區(qū)域的相應(yīng)cfDNA數(shù)量與CpG密度和GC含量呈負(fù)相關(guān)(圖3B)。在9個惡性腫瘤和10個良性腫瘤樣本之間共鑒定出57,575個DMR(51,962個低DMR和5613個高DMR)。正如預(yù)期的那樣,高DMR患者的CpG密度顯著高于低DMR患者(p<0.0001;圖3C)。因此,在所有惡性和良性樣本中,低DMR中cfDNA片段的平均數(shù)量顯著高于高DMR中的cfDNA片段平均數(shù)量(p<0.0001;圖3D)。CpG富集的高DMRs中cfDNA片段的缺失可能是由于cfDNA中開放的染色質(zhì)區(qū)域優(yōu)先被消化。這些發(fā)現(xiàn)有助于作者優(yōu)化低甲基化區(qū)域的cfDNA甲基化標(biāo)記。異常低甲基化,一般在cfDNA豐富的基因體或基因間區(qū)的封閉染色質(zhì)中,是各種惡性腫瘤的共同特征。為了保證高質(zhì)量的cfDNA定量,本文選擇了低DMRs作為候選的DNA甲基化標(biāo)記。
計算每個患者樣本的cfDNA惡性比率。利用發(fā)現(xiàn)隊列數(shù)據(jù),篩選出10個區(qū)分惡性和良性血漿樣本的DMR。它們大多位于基因間區(qū),其中惡性腫瘤患者的惡性比例明顯高于良性病變患者( p < 0.05 ;圖 3E)。但在10個甲基化標(biāo)記中,有4個功能基因( RYR2、 RYR3、 GABRB3和 DCDC2C )和2個lncRNA ( AC096570.1和LINC00923 )。
基于cfDNA甲基化的早期乳腺癌預(yù)測模型。利用cfDNA分子標(biāo)記物的惡性比率,使用隨機(jī)森林分類器(Random Forest)計算發(fā)現(xiàn)隊列中每個血漿樣本的cfDNA甲基化預(yù)測評分( cfMeth評分)。發(fā)現(xiàn)組和驗證組模型的曲線下面積( AUC )分別為0.89 (95 % CI , 0.84 ~ 0.94 ;圖 3F)和0.81 ( 95 % CI , 0.69 - 0.93 ;圖 3G ),優(yōu)于BI-RADS結(jié)果(AUC = 0.78 - 0.79 )或相關(guān)腫瘤標(biāo)志物檢測結(jié)果( CA15 - 3和CEA AUC = 0.57 - 0.70)。
cf Meth評分與影像診斷的組合模型。采用嶺回歸(ridge regression)方法在發(fā)現(xiàn)隊列中建立cf Meth評分與乳腺X光、超聲檢查的組合診斷模型。聯(lián)合模型的表現(xiàn)優(yōu)于任何一種單獨(dú)的方法( AUC = 0.94,95 % CI,0.90-0.97 ;圖3H )。惡性組和良性組在發(fā)現(xiàn)隊列和驗證隊列中的組合評分分布均有統(tǒng)計學(xué)差異。聯(lián)合模型的截斷點(diǎn)被選為在發(fā)現(xiàn)隊列中假陰性率小于2 %,其敏感性為98.7 %,特異性為68.8 %,準(zhǔn)確性為83.8 %。在驗證隊列中,性能相似( AUC = 0.93 [ 95 % CI , 0.84-1.00 ] );圖3I ),其敏感性為91.7 %,特異性為88.0 %,準(zhǔn)確性為89.8 %,沒有過度擬合的證據(jù)?傮w而言,聯(lián)合模型的檢出率分別為93.3 % ( 42 / 45 )、100 % ( 34 / 34 )、100 % ( 22 / 22 ),腫瘤Ⅰ、Ⅱ、Ⅲ期診斷的特異性為73.5 %。
圖3
結(jié)論
在單堿基分辨率下,作者進(jìn)行了基于血液的全基因組DNA甲基化檢測早期乳腺癌的研究,結(jié)果顯示液體活檢與傳統(tǒng)的診斷顯像相結(jié)合可以提高早期乳腺癌診斷的準(zhǔn)確性。