Fig 1. 成人甲基化圖譜
2. 甲基化的個(gè)體間變異
甲基化模式在不同的個(gè)體中非常穩(wěn)健。對(duì)于大多數(shù)細(xì)胞類型,0.5%或更少的細(xì)胞塊在不同的供體中顯示出50%或以上的差異,而在不同細(xì)胞類型的樣本中顯示出的差異為4.9%,說(shuō)明了DNA甲基化主要由細(xì)胞譜系和細(xì)胞類型特異性程序決定,而不是由遺傳或環(huán)境因素決定。
3. 甲基化記錄了發(fā)育歷史
雖然DNA甲基化模式反映了細(xì)胞的功能特性,但它們也可以用來(lái)追蹤細(xì)胞的發(fā)育歷史。為了識(shí)別早期祖細(xì)胞的后代共享的模式,作者計(jì)算了至少4個(gè)cpg塊內(nèi)的平均甲基化,并選擇了在所有樣本中顯示變異性最高的塊。然后使用一種無(wú)監(jiān)督的凝聚算法對(duì)所有205個(gè)甲基化組進(jìn)行了聚類,該分析系統(tǒng)地將相同細(xì)胞類型的生物樣本進(jìn)行了分組。這支持了細(xì)胞分離的可重復(fù)性,并表明每種正常細(xì)胞類型的三到四次重復(fù)足以推斷其甲基化模式,用于實(shí)際應(yīng)用,如生物標(biāo)志物識(shí)別。該算法沒(méi)有對(duì)相關(guān)的細(xì)胞類型進(jìn)行分組,而且通常根據(jù)供體身份對(duì)樣本進(jìn)行聚類。這進(jìn)一步強(qiáng)調(diào)了仔細(xì)純化均質(zhì)細(xì)胞類型的重要性,避免了混合細(xì)胞群。
Fig 2. 無(wú)監(jiān)督的聚集聚類反映了人類健康細(xì)胞類型的發(fā)育譜系
4. 細(xì)胞類型特異性的甲基化標(biāo)記物
將205個(gè)樣本組織成39組特定的細(xì)胞類型,包括血細(xì)胞類型、乳腺上皮、肺上皮、胰腺內(nèi)分泌和外分泌細(xì)胞、不同來(lái)源的血管內(nèi)皮細(xì)胞、心肌細(xì)胞和心肌成纖維細(xì)胞等。重點(diǎn)關(guān)注由5個(gè)或更多cpg組成的差異甲基化塊,這些cpg在一組細(xì)胞類型中未被甲基化,但在所有其他樣本中均被甲基化,反之亦然。幾乎所有區(qū)域(97%)在一種細(xì)胞類型中都未被甲基化,而在其他所有其他細(xì)胞類型中都被甲基化。然后根據(jù)靶細(xì)胞類型與所有其他樣本的甲基化的絕對(duì)差異對(duì)這些差異區(qū)域進(jìn)行了分類。
每種細(xì)胞類型的前25個(gè)差異未甲基化區(qū)域包含了一個(gè)由1246個(gè)標(biāo)記組成的人類細(xì)胞類型特異性甲基化圖譜。這些區(qū)域在特定的細(xì)胞類型中是獨(dú)特的未甲基化的(平均甲基化13%),在所有其他樣本中是甲基化的(平均甲基化91%),并且可以作為敏感的生物標(biāo)志物,用于定量來(lái)自混合物中特定細(xì)胞類型的DNA的存在。這些標(biāo)記物包括953個(gè)細(xì)胞類型特異性的未甲基化的位點(diǎn),以及另外293個(gè)未甲基化的位點(diǎn)在少數(shù)相關(guān)的細(xì)胞類型中。
Fig 3. 39種細(xì)胞類型的205個(gè)樣本的人類甲基化圖譜
5. 人類細(xì)胞類型特異性調(diào)控圖譜
作者分析了通過(guò)測(cè)序(ATAC-seq)、DNase I超敏位點(diǎn)測(cè)序(DNaseI-seq)和組蛋白修飾特異性標(biāo)記的DNA可及性和染色質(zhì)狀態(tài)。單核細(xì)胞和巨噬細(xì)胞的前250個(gè)未甲基化標(biāo)記物高度可及,在單核細(xì)胞中有H3K27ac和H3K4me1,而其他細(xì)胞類型的標(biāo)記物在單核細(xì)胞中沒(méi)有富集,其他細(xì)胞類型的標(biāo)記物也有類似的結(jié)果。還發(fā)現(xiàn)了chromHMM增強(qiáng)子注釋在細(xì)胞類型特異性標(biāo)記上富集。這些發(fā)現(xiàn)與之前的研究一致,即組織特異性去甲基化與基因增強(qiáng)子有關(guān)。
為了進(jìn)一步評(píng)估細(xì)胞類型特異性未甲基化區(qū)域的生物學(xué)重要性,作者研究了它們與轉(zhuǎn)錄因子(TFs)的關(guān)聯(lián),這些轉(zhuǎn)錄因子可能影響DNA甲基化,也可能以細(xì)胞類型特異性的方式結(jié)合DNA,這取決于甲基化和染色質(zhì)。作者鑒定了每個(gè)細(xì)胞類型的前1000個(gè)未甲基化標(biāo)記物,并使用HOMER39進(jìn)行了基序分析,從而計(jì)算已知TF結(jié)合基序的富集情況。對(duì)于大多數(shù)細(xì)胞類型,頂部基序包括主調(diào)節(jié)因子和關(guān)鍵TFs。這種細(xì)胞類型特異性的未甲基化區(qū)域和TF結(jié)合基序之間的關(guān)聯(lián)可以識(shí)別新的基因調(diào)控回路,并暴露在特定細(xì)胞類型中活躍的遠(yuǎn)端增強(qiáng)子。這突出了許多細(xì)胞類型的標(biāo)志性基因,并提出了每種細(xì)胞類型的前25個(gè)未甲基化標(biāo)記的假定靶點(diǎn)。這些發(fā)現(xiàn)進(jìn)一步支持了這樣一個(gè)原則,即特定細(xì)胞類型中未甲基化的位點(diǎn)可能是增強(qiáng)子,正向調(diào)節(jié)該細(xì)胞類型中表達(dá)的基因,通?刂凄徑。然而,在特定的細(xì)胞類型中,與特定未甲基化的位點(diǎn)相鄰的基因通常廣泛表達(dá)于這種細(xì)胞類型之外。
為了生成每種細(xì)胞類型中假定的調(diào)節(jié)區(qū)域的目錄,對(duì)每種細(xì)胞類型的所有樣本進(jìn)行了片段水平分析,獨(dú)立于其他細(xì)胞類型。掃描了整個(gè)基因組,并確定了至少85%具有至少4個(gè)cpg的DNA片段未甲基化的基因組區(qū)域。這在分析的39個(gè)細(xì)胞類型組中確定了一組未甲基化的基因組區(qū)域,其中平均包括36111個(gè)區(qū)域。然后對(duì)這些區(qū)域進(jìn)行了基因組特征注釋,結(jié)果顯示,平均56%的CpG島重疊,46%位于啟動(dòng)子區(qū)域附近,44%的CTCF結(jié)合位點(diǎn)重疊,從而突出了未甲基化位點(diǎn)的調(diào)控和結(jié)構(gòu)作用。
Fig 4. 細(xì)胞類型特異性標(biāo)記作為假定的增強(qiáng)因子
6. 細(xì)胞類型特異性的高甲基化位點(diǎn)
作者研究了那些在一種細(xì)胞類型中甲基化但在人體其他地方未甲基化的基因組區(qū)域。這些區(qū)域富集于CpG島(38%的甲基化區(qū)域,而細(xì)胞類型特異性的未甲基化區(qū)域?yàn)?.7-2.7%),并在其他細(xì)胞類型中被H3K27me3和Polycomb標(biāo)記。這些細(xì)胞類型特異性的高甲基化區(qū)域通常對(duì)基序富集不那么顯著,只有大約3%的細(xì)胞類型特異性差異甲基化區(qū)域被高甲基化。
在匯集了所有細(xì)胞類型特異性的高甲基化區(qū)域后,發(fā)現(xiàn)了染色質(zhì)調(diào)節(jié)因子CTCF的目標(biāo)序列的強(qiáng)富集。這表明CTCF結(jié)合位點(diǎn)的DNA甲基化可能作為一個(gè)組織特異性的調(diào)控開(kāi)關(guān)來(lái)調(diào)節(jié)其結(jié)合,并可能影響組織特異性。為了驗(yàn)證這一想法,作者比較了CTCF位點(diǎn)的DNA甲基化模式與特定組織中全基因組CTCF蛋白結(jié)合模式。特定細(xì)胞類型中甲基化的位點(diǎn)被富集為神經(jīng)基因轉(zhuǎn)錄抑制因子re1沉默TF/神經(jīng)元限制性沉默因子(REST/ NRSF)的靶點(diǎn)(P≤1×10-24),這在胰島細(xì)胞的甲基化組中最為顯著。雖然DNA甲基化尚未被證明會(huì)影響REST的結(jié)合或活性,但這一發(fā)現(xiàn)提出了一種可能性,即胰島中REST靶點(diǎn)的甲基化可以允許獨(dú)立于REST抑制的內(nèi)分泌分化。
Fig 5. CpG島、Polycomb靶點(diǎn)、CTCF和REST/NSRF的細(xì)胞類型特異性高甲基化區(qū)域豐富
7. 片段級(jí)的甲基化組反褶積
作者開(kāi)發(fā)了一種用于DNA甲基化測(cè)序數(shù)據(jù)的計(jì)算片段級(jí)反褶積算法,并使用每種細(xì)胞類型定義的前25個(gè)標(biāo)記(共1246個(gè)標(biāo)記)來(lái)研究從復(fù)合組織樣本和cfDNA中獲得的甲基組。
對(duì)于每一種細(xì)胞類型,作者采用留一的方法在白細(xì)胞讀取中混合一個(gè)保留的樣本,然后使用反褶積算法來(lái)推斷混合物中的細(xì)胞組成。在濃度從0到10%不同的情況下重復(fù)了這個(gè)過(guò)程。如圖6a所示,發(fā)現(xiàn)1246個(gè)標(biāo)記(每個(gè)細(xì)胞類型的前25個(gè))可以在大約0.1%的分辨率下準(zhǔn)確檢測(cè)來(lái)自給定來(lái)源的DNA,與基于陣列的方法相比,提高了近一個(gè)數(shù)量級(jí)。
利用來(lái)自23名健康捐贈(zèng)者的WGBS數(shù)據(jù)估計(jì)了白細(xì)胞和cfDNA的細(xì)胞組成;99.5%的白細(xì)胞來(lái)源的DNA屬于粒細(xì)胞、單核細(xì)胞、巨噬細(xì)胞和NK、T和B細(xì)胞,與典型的血細(xì)胞計(jì)數(shù)一致。健康受試者的cfDNA主要來(lái)源于白細(xì)胞:粒細(xì)胞(29.7%)、單核/巨噬細(xì)胞(20%)和淋巴細(xì)胞(3%)。有助于cfDNA的實(shí)體組織包括血管內(nèi)皮細(xì)胞(6%)和肝細(xì)胞(3.1%),與之前的結(jié)
果一致。
參考文獻(xiàn):
Loyfer N, Magenheim J, Peretz A, Cann G, Bredno J, Klochendler A, Fox-Fisher I, Shabi-Porat S, Hecht M, Pelet T, Moss J, Drawshy Z, Amini H, Moradi P, Nagaraju S, Bauman D, Shveiky D, Porat S, Dior U, Rivkin G, Or O, Hirshoren N, Carmon E, Pikarsky A, Khalaileh A, Zamir G, Grinbaum R, Abu Gazala M, Mizrahi I, Shussman N, Korach A, Wald O, Izhar U, Erez E, Yutkin V, Samet Y, Rotnemer Golinkin D, Spalding KL, Druid H, Arner P, Shapiro AMJ, Grompe M, Aravanis A, Venn O, Jamshidi A, Shemer R, Dor Y, Glaser B, Kaplan T. A DNA methylation atlas of normal human cell types. Nature. 2023 Jan;613(7943):355-364. doi: 10.1038/s41586-022-05580-6. Epub 2023 Jan 4. PMID: 36599988; PMCID: PMC9811898.