Pippin 片段回收儀增加全新“Range+T”模式,助力Pacbio HiFi測(cè)序高質(zhì)量文庫(kù)構(gòu)建
PacBio 獨(dú)有的HiFi測(cè)序技術(shù),可同時(shí)實(shí)現(xiàn)長(zhǎng)讀長(zhǎng)和高準(zhǔn)確性的DNA測(cè)序,在解析復(fù)雜的基因組區(qū)域、檢測(cè)結(jié)構(gòu)變異、揭示罕見(jiàn)變異和研究表觀遺傳學(xué)等多個(gè)領(lǐng)域有廣泛應(yīng)用。為了確保HiFi測(cè)序的產(chǎn)量和質(zhì)量,需要將DNA文庫(kù)大小控制在15-18kb范圍內(nèi)。因此,高精度的片段篩選是PacBio HiFi測(cè)序的關(guān)鍵步驟之一。Sage Science公司提供的Pippin系列全自動(dòng)DNA片段回收儀--基于脈沖場(chǎng)電泳,可以實(shí)現(xiàn)上述需求,現(xiàn)已成為HiFi文庫(kù)構(gòu)建的金標(biāo)準(zhǔn)和建庫(kù)必備工具之一。
為了獲得更高質(zhì)量的HiFi文庫(kù),Sage Science公司不斷優(yōu)化篩選方法,并于今年6月推出了全新的長(zhǎng)片段回收模式“Range+T”。結(jié)合相對(duì)應(yīng)的預(yù)制膠試劑盒,“Range+T”模式可有效提高9-30kb范圍內(nèi)片段篩選的分辨率,協(xié)助用戶更精準(zhǔn)的控制HiFi文庫(kù)大小,實(shí)現(xiàn)片段讀取長(zhǎng)度和質(zhì)量間的平衡,得到更好的基因組組裝結(jié)果。
運(yùn)用“Range+T”模式,只需設(shè)置回收范圍起點(diǎn)DNA的bp值,以及回收時(shí)間(一般5-30min)即可,例如:15kb+10min。此模式的優(yōu)點(diǎn)包括:(1)有效去除設(shè)置起點(diǎn)外的小片段DNA;(2)可以更精準(zhǔn)的控制文庫(kù)回收的上限;(3)可以更精準(zhǔn)調(diào)整文庫(kù)分布的寬度。近日,Sage Science公司攜手亞利桑那大學(xué)基因組研究所,以植物基因組為樣本,共同測(cè)試了“Range+T”模式對(duì)于增加PacBio HiFi文庫(kù)平均讀長(zhǎng)的能力。由于植物基因組的復(fù)雜性更高(多倍體、重復(fù)序列、大小差異大等),因此更長(zhǎng)的HiFi讀取長(zhǎng)度對(duì)植物基因組研究更重要。
“Range+T”片段篩選模式增加PacBio HiFi平均讀長(zhǎng)
研究成果:
1. 不同回收時(shí)間對(duì)回收得率和回收范圍的影響
小麥基因組DNA經(jīng)打斷儀處理后,使用PippinHT回收目標(biāo)片段。使用“Range+T”回收模式,不同樣本的回收起點(diǎn)均設(shè)置為15kb,回收時(shí)間分別設(shè)置為13-30min。
圖1“Range+T”模式回收的精確性
回收后檢測(cè)結(jié)果顯示,不同泳道回收起點(diǎn)的位置相同,回收的終點(diǎn)與設(shè)置的回收時(shí)間長(zhǎng)短相關(guān),設(shè)置30min的回收時(shí)間可以回收樣品中更多的HWM DNA。
2. 小片段去除效果
圖2“Range+T”模式小片段去除結(jié)果
如圖2所示,SC28+29樣品混合后(藍(lán)色),PippinHT “Range+T”模式設(shè)置為13kb+30min進(jìn)行片段回收,回收后樣品有效去除回收起點(diǎn)以下的小片段DNA(紅色),結(jié)果也在Pacbio測(cè)序結(jié)果中reads長(zhǎng)度分布圖(圖2中測(cè)序結(jié)果圖)得以體現(xiàn)。
3. 重復(fù)性測(cè)試
8個(gè)木薯樣本的基因組DNA被打斷成13-25kb(平均長(zhǎng)度18kb),“Range+T”模式設(shè)置為13kb+30min進(jìn)行片段回收,回收得率在33-45%之間,回收后平均片段長(zhǎng)度在19-20kb之間,HiFi reads結(jié)果長(zhǎng)度保持一致。
表1 “Range+T”模式重復(fù)性測(cè)試結(jié)果
圖3 “Range+T”模式重復(fù)性測(cè)試Femto Pulse檢測(cè)結(jié)果
4. 長(zhǎng)片段回收能力
以3個(gè)玉米樣本為例,基因組DNA打斷成15-35kb片段(平均長(zhǎng)度23-25kb)。“Range+T”模式回收起點(diǎn)分別設(shè)置在17kb-20kb,回收時(shí)間均為30min。結(jié)果表明DNA回收得率從17%到41%不等,可檢測(cè)的最大片段長(zhǎng)度約為50kb,提高回收起點(diǎn)會(huì)得到更大的片段分布,從而產(chǎn)生更長(zhǎng)的平均HiFi read長(zhǎng)度。
圖4 “Range+T”模式長(zhǎng)片段回收測(cè)試結(jié)果
5. 對(duì)測(cè)序質(zhì)量影響
為了研究測(cè)序結(jié)果在產(chǎn)量、read質(zhì)量和平均HiFi read長(zhǎng)度之間得到更好的平衡,作者對(duì)比了PippinHT 之前軟件版本9-13kb篩選模式的測(cè)序結(jié)果(圖5中的藍(lán)色符號(hào))與最新“Range+T” 模式的測(cè)序結(jié)果(圖5中的橙色符號(hào))。使用“Range+T”模式,回收起點(diǎn)設(shè)置為15kb,其產(chǎn)生的reads平均長(zhǎng)度在21-22kb以上,且30-40kb長(zhǎng)度reads數(shù)量有顯著提高。更重要的是,數(shù)據(jù)(圖5a)表明在13kb至22kb的范圍內(nèi),隨著平均HiFi read長(zhǎng)度的增加,HiFi測(cè)序數(shù)據(jù)產(chǎn)量幾乎沒(méi)有下降。由于PacBio測(cè)序中聚合酶讀取長(zhǎng)度有限,短的SMRTbell文庫(kù)比長(zhǎng)文庫(kù)具有更高的QV分?jǐn)?shù),但此次實(shí)驗(yàn)中較長(zhǎng)文庫(kù)的最低平均QV分?jǐn)?shù)仍然相當(dāng)好,為28。88%的較長(zhǎng)文庫(kù)(橙色符號(hào))的平均QV得分在30以上(圖5.b-c)。
圖5 不同設(shè)置HiFi測(cè)序產(chǎn)量及QV結(jié)果
為了更好地說(shuō)明較長(zhǎng)文庫(kù)的質(zhì)量結(jié)果,圖6顯示了一個(gè)平均subreads長(zhǎng)度為22.6kb的玉米樣本的reads質(zhì)量分布,其中約40%的reads得分在Q30以上。
圖6 玉米文庫(kù)Read質(zhì)量分布結(jié)果,平均長(zhǎng)度為22.6kb
為了體現(xiàn)更長(zhǎng)read對(duì)基因組組裝的影響,作者組裝了三個(gè)數(shù)據(jù)集。數(shù)據(jù)來(lái)自基于“Range+T”模式的PacBio-HiFi文庫(kù)(表1的玉米樣本)。文庫(kù)的覆蓋率為18×,平均HiFi read長(zhǎng)度為20.6kb。生成了以下三個(gè)具有不同特征的數(shù)據(jù)集(表2):
- “Small”數(shù)據(jù)集:從所有reads的3'端刪除4000個(gè)bp。這使得reads保留了原始分布形狀,但reads長(zhǎng)度整體被縮短,平均長(zhǎng)度為16kb。
- “Long”數(shù)據(jù)集:將原始的20kb文庫(kù)測(cè)序覆蓋率調(diào)整為~14.5×,以匹配“Small”數(shù)據(jù)集的數(shù)據(jù)量。
- “Narrow”數(shù)據(jù)集:所有最長(zhǎng)reads被截?cái)嘀良s17kb,用以模擬窄分布的SMRTbell文庫(kù)。為了與其他兩個(gè)數(shù)據(jù)集相匹配,總體覆蓋率也有所降低。
“Small”數(shù)據(jù)集代表PacBio文庫(kù)制備的當(dāng)前標(biāo)準(zhǔn),而“Long”數(shù)據(jù)集結(jié)果證明了“Range+T”模式的優(yōu)勢(shì)。與其他數(shù)據(jù)集相比,“Long”數(shù)據(jù)集具有最低的contigs數(shù)量、最高的平均contigs長(zhǎng)度和最高的Nx值(表2)。此外,開(kāi)發(fā)“Narrow”數(shù)據(jù)集是為了研究更長(zhǎng)read對(duì)改進(jìn)組裝效果的貢獻(xiàn)。
表2 玉米M組裝統(tǒng)計(jì)數(shù)據(jù)集
結(jié)論:
測(cè)試結(jié)果說(shuō)明PippinHT最新的“Range+T”模式,可以更加靈活地選擇PacBio HiFi文庫(kù)的大小。“Range+T”模式具備較好的重復(fù)性,可以有效去除短片段,且使平均read長(zhǎng)度超過(guò)當(dāng)前標(biāo)準(zhǔn)。此外,新模式可以控制文庫(kù)片段范圍的上限,更長(zhǎng)的文庫(kù)并沒(méi)有影響測(cè)序質(zhì)量和產(chǎn)量。與較小的HiFi文庫(kù)相比,更有助于大而復(fù)雜基因組的連續(xù)組裝。
目前PippinHT “Range+T”模式的新版軟件已經(jīng)發(fā)布,Blue Pippin也將在近期發(fā)布,詳細(xì)信息請(qǐng)聯(lián)系:
▼環(huán)亞生物科技有限公司▼
地址:上海市閔行區(qū)友東路358號(hào)閔欣大廈1號(hào)樓701/703/705室
電話:021-54583565
郵箱:
info@apgbio.com
網(wǎng)址:
www.apgbio.com
Sage Science是全球領(lǐng)先的研發(fā)制造Pippin系列全自動(dòng)核酸電泳片段回收儀的生產(chǎn)廠家,擁有美國(guó)技術(shù)專利,各個(gè)型號(hào)產(chǎn)品可以高效完成不同長(zhǎng)度范圍的DNA片段的精準(zhǔn)回收,廣泛用于二代測(cè)序、三代測(cè)序以及多種分子生物學(xué)相關(guān)領(lǐng)域。
環(huán)亞生物科技有限公司作為美國(guó)Sage Science公司在中國(guó)區(qū)的獨(dú)家代理商,自2011年以來(lái)將Sage Science的產(chǎn)品線引入國(guó)內(nèi),一直為國(guó)內(nèi)用戶提供專業(yè)的全自動(dòng)核酸片段回收系統(tǒng)的安裝測(cè)試、應(yīng)用培訓(xùn),技術(shù)支持與售后維護(hù)工作,贏得客戶的一致好評(píng)與信任。環(huán)亞生物科技有限公司將一如既往的支持越來(lái)越多的Sage Science用戶。