圖1. 華大智造發(fā)布MGIEasy stLFR文庫(kù)制備試劑盒
2018年10月25日,第十三屆國(guó)際基因組學(xué)大會(huì)(簡(jiǎn)稱(chēng)“ICG-13”)在深圳隆重召開(kāi)。華大智造同期舉行“基因組學(xué)技術(shù)與應(yīng)用研討會(huì)”,并在會(huì)上發(fā)布MGIEasy stLFR文庫(kù)制備試劑盒。MGIEasy stLFR文庫(kù)構(gòu)建試劑盒是世界范圍內(nèi)首款基于無(wú)分隔共標(biāo)記方法的長(zhǎng)片段讀取試劑盒,該試劑盒利用高精度短讀序列獲得長(zhǎng)距離信息,融匯二代三代測(cè)序技術(shù)之長(zhǎng),被譽(yù)為“完美的WGS建庫(kù)”。
該技術(shù)于2018年3月在國(guó)際人類(lèi)基因組大會(huì)(Human Genome Meeting,簡(jiǎn)稱(chēng)HGM)正式發(fā)布,今年10月成功轉(zhuǎn)化為試劑盒產(chǎn)品并發(fā)布;谌A大智造專(zhuān)利的DNA分子共標(biāo)簽技術(shù),即將來(lái)源于同一DNA長(zhǎng)片段的短讀測(cè)序片段標(biāo)記上相同分子標(biāo)簽,stLFR實(shí)現(xiàn)了基于高精度短讀測(cè)序獲取長(zhǎng)片段DNA信息 (圖2)。與華大智造世界領(lǐng)先的DNBseq™測(cè)序技術(shù)相結(jié)合,stLFR技術(shù)能夠?qū)崿F(xiàn)高質(zhì)量變異檢測(cè),二倍體基因組定相,結(jié)構(gòu)變異解析及其他長(zhǎng)讀長(zhǎng)應(yīng)用。
為了讓用戶(hù)第一時(shí)間體驗(yàn)該技術(shù),華大智造招募首批試用客戶(hù)(可掃描文末二維碼申請(qǐng))。相比傳統(tǒng)WGS文庫(kù)和其他同類(lèi)產(chǎn)品,stLFR文庫(kù)僅需1 ng DNA且無(wú)需預(yù)擴(kuò)增即可獲得高質(zhì)量的全基因組測(cè)序文庫(kù);二倍體定相區(qū)塊N50值可達(dá)10 Mb,有效檢出倒位、異位、刪除等結(jié)構(gòu)變異;單管無(wú)分隔反應(yīng),無(wú)需微量移液設(shè)備或復(fù)雜微流控系統(tǒng);全部反應(yīng)在磁珠上完成,易于高通量自動(dòng)化建庫(kù)。
圖2. stLFR技術(shù)原理示意圖。該技術(shù)從提取好的長(zhǎng)片段DNA起始,將轉(zhuǎn)座子序列隨機(jī)插入至長(zhǎng)片段DNA中,利用DNA雙鏈互補(bǔ)原理將該產(chǎn)物與帶有多拷貝分子標(biāo)簽的磁珠載體結(jié)合,在引入第二個(gè)接頭后進(jìn)行PCR擴(kuò)增,最終完成文庫(kù)構(gòu)建。
stLFR -數(shù)據(jù)表現(xiàn)
長(zhǎng)片段讀取
利用DNA共標(biāo)記方法,MGIEasy stLFR試劑盒可以檢測(cè)分析DNA分子長(zhǎng)度平均長(zhǎng)度可達(dá)50-70 Kb,最大值可超過(guò)300 kb(圖3A)注1。不僅如此,得益于stLFR文庫(kù)超高的分子標(biāo)簽數(shù),超過(guò)85%的標(biāo)簽內(nèi)有且僅有一個(gè)DNA長(zhǎng)分子(圖3B)注2,這賦予了stLFR文庫(kù)一些可以媲美單分子測(cè)序的數(shù)據(jù)特性。
注1:該數(shù)據(jù)表現(xiàn)決定于初始DNA提取長(zhǎng)度。
注2:該數(shù)據(jù)表現(xiàn)決定于初始DNA投入量和DNA提取長(zhǎng)度。
圖3. stLFR 長(zhǎng)片段讀取特征。(A)片段長(zhǎng)度分布。stLFR文庫(kù)可以檢測(cè)的DNA分子長(zhǎng)度典型值一般為50 Kb左右,最長(zhǎng)可達(dá)300 Kb。(B)每個(gè)標(biāo)簽內(nèi)的長(zhǎng)片段數(shù)量分布。從1 ng DNA起始構(gòu)建stLFR文庫(kù)時(shí),約有85% 標(biāo)簽內(nèi)有且僅有一個(gè)DNA長(zhǎng)分子。
覆蓋均勻性
從1 ng DNA起始,stLFR文庫(kù)即可獲得與使用100 ng DNA起始的常規(guī)全基因組測(cè)序文庫(kù)相當(dāng)?shù)幕蚪M覆蓋均勻性表現(xiàn)(圖4)。
圖4. stLFR 文庫(kù)測(cè)序深度均勻性。藍(lán)色實(shí)線(xiàn)為stLFR文庫(kù),綠色虛線(xiàn)為100 ng起始的常規(guī)全基因組測(cè)序文庫(kù),灰色虛線(xiàn)為理論預(yù)期深度分布(泊松分布),數(shù)據(jù)已均一化至30X覆蓋度。
SNP & InDel檢測(cè)
30X深度下,stLFR文庫(kù)SNP檢測(cè)陽(yáng)性預(yù)測(cè)值(Positive predictive value, PPV)與靈敏度(Sensitivity)均可達(dá)到0.99以上,InDel檢測(cè)F值(F-measure)可達(dá)0.95,整體變異檢測(cè)表現(xiàn)達(dá)到相同深度的常規(guī)全基因組測(cè)序文庫(kù)表現(xiàn)的最佳水平(圖5)。
圖5. stLFR 文庫(kù)30X覆蓋度變異檢測(cè)能力評(píng)估。將stLFR檢測(cè)NA12878樣本的變異結(jié)果與Genome in a bottle(GIAB)提供的高置信區(qū)間檢測(cè)結(jié)果進(jìn)行比較,計(jì)算陽(yáng)性預(yù)測(cè)值與靈敏度。
二倍體定相
利用共標(biāo)簽短讀序列,stLFR可以輕松獲得二倍體基因組上雜合位點(diǎn)定相信息,定相區(qū)塊N50值可達(dá)10 Mb以上(圖6)注3,可有效解析基因調(diào)控和編碼區(qū)變異組合。
注3: 該數(shù)據(jù)表現(xiàn)共同決定于初始DNA長(zhǎng)度和測(cè)序深度。
圖6. stLFR 定相區(qū)塊在染色體上的分布情況。在40X深度下,stLFR文庫(kù)數(shù)據(jù)定相區(qū)塊N50值可達(dá)34 Mb,雜合位點(diǎn)定相比例高達(dá)99.7%
利用分子標(biāo)簽和長(zhǎng)片段信息,stLFR可以對(duì)多種結(jié)構(gòu)變異進(jìn)行準(zhǔn)確檢測(cè)。圖7展示了stLFR對(duì)NA12878中已知的SV進(jìn)行檢測(cè),檢出率達(dá)到100%。圖8展示了利用stLFR文庫(kù)分別對(duì)攜帶5號(hào)染色體和12號(hào)染色體平衡易位病人樣本(圖8A)和已知2號(hào)染色體染色體內(nèi)倒位的GM20759細(xì)胞系樣本(圖8B)進(jìn)行檢測(cè)的結(jié)果。
圖7. 對(duì)NA12878中已知的SV進(jìn)行檢測(cè),檢出率能達(dá)到100%
圖8. stLFR 文庫(kù)結(jié)構(gòu)變異結(jié)果展示。(A)攜帶5號(hào)染色體和12號(hào)染色體平衡易位病人樣本的stLFR檢測(cè)的分子標(biāo)簽重疊熱度分布圖。(B)已知2號(hào)染色體染色體內(nèi)發(fā)生倒位的GM20759細(xì)胞系樣本分子標(biāo)簽重疊熱度分布圖。
stLFR變異檢測(cè)能力總結(jié)
古語(yǔ)有云,十年磨一劍。華大智造已經(jīng)投入了五年時(shí)間進(jìn)行stLFR技術(shù)的研發(fā),并且會(huì)繼續(xù)對(duì)該技術(shù)進(jìn)行優(yōu)化升級(jí)。更多基于stLFR的技術(shù),如二倍體從頭組裝等,也將陸續(xù)面世。希望在不遠(yuǎn)的將來(lái),可以通過(guò)stLFR技術(shù)最終實(shí)現(xiàn)完美基因組測(cè)序。
掃描下方二維碼,申請(qǐng)測(cè)試stLFR文庫(kù)制備試劑盒