Bionano OGM是一種強大的光學(xué)圖譜技術(shù),它使用超長DNA分子從頭構(gòu)建整個基因組,并能夠有效地檢測基因組結(jié)構(gòu)變異。同時它還能用于基因組功能分析,如表觀遺傳學(xué)、DNA復(fù)制圖譜和動力學(xué)分析等。其原理是利用熒光標(biāo)記基因組上特定序列,在納米孔道中電泳拉直DNA后拍照獲得熒光的分布,進(jìn)而分析特定序列在基因組上的分布和狀態(tài);谠撛,Bionano研發(fā)團隊和科學(xué)界一起開發(fā)了多種熒光標(biāo)記方法,并不斷探索其在基因組研究中的應(yīng)用方向。例如基于特殊甲基轉(zhuǎn)移酶的DLS標(biāo)記方案和基于基因組缺刻酶的NLRS標(biāo)記方案。除此之外還有很多特殊的標(biāo)記方法,其中不乏非常有前景的方向。2019年Bionano研發(fā)團隊與科研工作者在Genome Research雜志上公布了一種基于熒光甲基化圖譜的檢測方案-ROM, 并測試了該方法在面肩肱型肌營養(yǎng)不良癥 (FSHD)中的應(yīng)用【1】。
DNA甲基化與研究方法
DNA甲基化在調(diào)節(jié)基因表達(dá)中發(fā)揮關(guān)鍵作用;騿幼拥募谆癄顟B(tài)可以預(yù)測基因活性,且研究發(fā)現(xiàn)發(fā)育過程中和疾病中的DNA甲基化與基因表達(dá)和蛋白質(zhì)豐度相關(guān)。目前DNA甲基化的主要研究方法是NGS甲基化測序,即利用不同手段將甲基化和非甲基化的堿基區(qū)分并分別測序。但是甲基化測序需要較高的深度,并且經(jīng)常需要同時對未處理的原始DNA進(jìn)行測序比較,因此成本相對較高;同時在基因組中復(fù)雜度較低的重復(fù)區(qū)域中,由于NGS測得的序列較短,存在比對困難,對于這些區(qū)域的甲基化狀態(tài)很難解析。三代測序(SMRT和ONT測序)雖然能夠?qū)NA甲基化狀態(tài)直接檢測,但也存在通量低,成本高的不足。在全基因組光學(xué)圖譜(OGM)分析中,增加熒光基團標(biāo)記甲基化或者非甲基化DNA片段,就可以對全基因組范圍內(nèi)的甲基化狀態(tài)進(jìn)行研究。由于OGM檢測單分子超長DNA片段,在分析低復(fù)雜的重復(fù)區(qū)域中具有先天優(yōu)勢。
ROM標(biāo)記方案
如圖1所示,ROM標(biāo)記主要有兩個步驟(具體條件可參考原文【1】):
缺刻酶介導(dǎo)的NLR全基因組標(biāo)記: 抽提的超長片段基因組DNA在缺刻酶作用下在對應(yīng)的基因組片段上產(chǎn)生缺口。隨后利用Taq DNA合成酶進(jìn)行缺口平移,同時將帶有熒光標(biāo)記基團的dNTP摻入新合成的鏈中。最后在Taq DNA連接酶的作用下將缺口連接,形成完整的雙鏈。這樣熒光標(biāo)記就在相應(yīng)的基因組序列motif附近出現(xiàn)。
M.TaqI甲基轉(zhuǎn)移酶介導(dǎo)的熒光標(biāo)記: M.TaqI甲基轉(zhuǎn)移酶可以在基因組中特定motif(TCGA)的腺嘌呤(A)上轉(zhuǎn)入一個甲基,但是這個反應(yīng)會受到鄰近的CpG中C堿基的甲基化或者羥甲基化影響。也就是說一旦TCGA中的C堿基是被甲基化或者羥甲基化的,該反應(yīng)就會無法完成。ROM分析將甲基轉(zhuǎn)移反應(yīng)的底物替換成帶有熒光標(biāo)記的類似物,就可以區(qū)分出TCGA中的甲基化狀態(tài)。
雙色熒光標(biāo)記: 抽提的超長片段DNA首先使用NLR缺刻酶全基因組標(biāo)記并使用紅色熒光標(biāo)記基團;隨后500ng標(biāo)記好的DNA使用M.TaqI甲基轉(zhuǎn)移酶和綠色熒光底物進(jìn)行第二輪標(biāo)記;標(biāo)記完成后使用藍(lán)色染料對DNA骨架進(jìn)行染色。隨后得到的標(biāo)記染色后的DNA在Bionano OGM平臺上進(jìn)行電泳和數(shù)據(jù)收集。
圖1 M.TaqI甲基轉(zhuǎn)移酶區(qū)分甲基化非甲基化標(biāo)記原理
ROM可行性驗證
為了驗證該方法的可行性,研究團隊使用ROM 針對FSHD相關(guān)區(qū)域(D4Z4 repeats)同時進(jìn)行了拷貝數(shù)和甲基化的分析。
FSHD-associated D4Z4 repeats BAC文庫測試
將正常人的D4Z4區(qū)段轉(zhuǎn)入BAC文庫后,研究團隊使用多種方法對其進(jìn)行了分析。
1. 首先使用超高深度(大于15000X)NGS測序,希望利用重復(fù)區(qū)域和非重復(fù)區(qū)域的測序深度比例來推測拷貝數(shù)。然而作者發(fā)現(xiàn)兩種區(qū)域內(nèi)部的深度變異也非常大(非重復(fù)區(qū)域平均差在25%左右,重復(fù)區(qū)域更是高達(dá)63%),推測會造成估算的不準(zhǔn)確。最終利用平均深度的比例,NGS預(yù)測D4Z4重復(fù)次數(shù)為8,但是不確定性非常大。
2. 隨后使用NLR方法將BAC文庫分子標(biāo)記上紅色熒光基團后,在修飾后的玻片上拉直,熒光顯微鏡下直接觀察。通過直接計數(shù)標(biāo)記個數(shù)(D4Z4每一個repeat中都有一個標(biāo)記位點),直觀得到了準(zhǔn)確的D4Z4重復(fù)數(shù)為22(如圖2)。
圖2 左: D4Z4 repeats BAC文庫示意圖右: 標(biāo)記后的單個BAC分子
3. 標(biāo)記后的DNA在Iyrs平臺上進(jìn)行電泳拍照,利用單分子組裝成D4Z4區(qū)域的完整圖譜。通過和參考基因組的比較得到D4Z4 repeats的個數(shù)為22 ± 1(圖3)。
圖3 OGM組裝后的分子和圖譜,灰色區(qū)域為非D4Z4重復(fù)區(qū)段
4. 最后針對BAC文庫進(jìn)行了ROM分析。作者使用紅色熒光來確定基因組標(biāo)記,綠色熒光來標(biāo)記甲基化狀態(tài)。使用非甲基化修飾的BAC文庫和部分甲基化的BAC文庫顯示了非常明顯的熒光信號區(qū)別(圖4),從而證明ROM是一種可行的甲基化分析方案。
圖4 甲基化和部分甲基化BAC文庫的ROM分析結(jié)果
FSHD 家系樣本測試在一個FSHD家系中,使用ROM分析了一個病人樣本和一個健康親屬樣本;蚪M組裝結(jié)果顯示在FSHD病人中,致病D4Z4重復(fù)數(shù)(4qA)為4, 而健康親屬的D4Z4重復(fù)數(shù)(4qA)為26;兩個樣本另外一個等位基因均為非致病性的4qB,且重復(fù)數(shù)為48(圖5)。
圖5 D4Z4片段重復(fù)數(shù),左側(cè)為陽性樣本,右側(cè)為陰性樣本
ROM分析也發(fā)現(xiàn)FSHD陽性樣本中,無論是D4Z4重復(fù)的單個片段甲基化程度(圖6)還是平均甲基化程度(圖7)都明顯低于陰性樣本,從而證明D4Z4重復(fù)片段的去甲基化與FSHD疾病的相關(guān)。
圖6 ROM分析信號,左側(cè)為陽性樣本,右側(cè)為陰性樣本
圖7 ROM分析顯示的平均去甲基化程度,左側(cè)為陽性樣本,右側(cè)為陰性樣本
總結(jié)
OGM技術(shù)能夠結(jié)合多種標(biāo)記手段,ROM為我們展示了結(jié)合基因組骨架標(biāo)記和甲基化標(biāo)記的分析方案。相信可以期待更多的特異性或非特異性標(biāo)記技術(shù)與OGM骨架標(biāo)記結(jié)合,完成針對不同應(yīng)用的分析。