综合图区亚洲网友自拍|亚洲黄色网络|成人无码网WWW在线观看,日本高清视频色视频kk266,激情综合五月天,欧美一区日韩一区中文字幕页

English | 中文版 | 手機(jī)版 企業(yè)登錄 | 個(gè)人登錄 | 郵件訂閱
當(dāng)前位置 > 首頁(yè) > 技術(shù)文章 > 綜述:高通量測(cè)序技術(shù)的原理及各平臺(tái)優(yōu)勢(shì)和實(shí)踐應(yīng)用的分析

綜述:高通量測(cè)序技術(shù)的原理及各平臺(tái)優(yōu)勢(shì)和實(shí)踐應(yīng)用的分析

瀏覽次數(shù):10875 發(fā)布日期:2016-5-30  來(lái)源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
隨著人類(lèi)基因組計(jì)劃(human genome project )在2003年順利完成,基因組測(cè)序技術(shù)取得了長(zhǎng)足的進(jìn)步,這直接導(dǎo)致了每兆基因組成本的大幅下降以及檢測(cè)的基因組數(shù)量越來(lái)越多。人們對(duì)基因組的復(fù)雜性深感震驚,這也引導(dǎo)著測(cè)序技術(shù)的進(jìn)一步發(fā)展。最近的一些突破性技術(shù)使得測(cè)序技術(shù)在更短的時(shí)間內(nèi)可以獲得更多的數(shù)據(jù)量。與之對(duì)應(yīng)的是,還有一些技術(shù)的進(jìn)步使得單條序列的測(cè)序讀長(zhǎng)變得更長(zhǎng)——這對(duì)解析結(jié)構(gòu)性的復(fù)合區(qū)段是極其必要的。這些進(jìn)展給科研人員以及醫(yī)療診斷人員提供了一個(gè)絕佳的平臺(tái)使得人們對(duì)基因組變異導(dǎo)致的表型變化以及疾病發(fā)生有了進(jìn)一步的了解。

近日,美國(guó)冷泉港實(shí)驗(yàn)室聯(lián)合加州大學(xué)戴維斯分校的研究人員在國(guó)際著名評(píng)論型綜述雜志Nature Reviews Genetics(影響因子41)上發(fā)表了一篇評(píng)論型綜述。該綜述對(duì)高通量測(cè)序的技術(shù)原理以及各平臺(tái)的優(yōu)勢(shì)比較和實(shí)踐應(yīng)用進(jìn)行了深入淺出的分析。



介紹
自從DNA的雙螺旋結(jié)構(gòu)被人們解析開(kāi)始1,人們?cè)谔骄拷】蹬c疾病的基因組的復(fù)雜性與差異性上做出了巨大的努力。為了支持人類(lèi)基因組計(jì)劃的順利進(jìn)行2,人們?cè)趦x器和試劑上做出了巨大的改進(jìn)。該計(jì)劃的完成使得人們強(qiáng)烈的意識(shí)到人們需要更多更好的技術(shù)與數(shù)據(jù)分析能力來(lái)回答隨之而來(lái)的一系列生物學(xué)問(wèn)題。然而,通量的限制以及居高不下的測(cè)序成本成為了人們進(jìn)一步了解基因組的一道坎。2000年之后推出的高通量測(cè)序平臺(tái)很好地解決了這個(gè)問(wèn)題,人類(lèi)基因組測(cè)序的成本直接因此下降50000倍,并且由此產(chǎn)生了一個(gè)新的名詞:下一代測(cè)序(next-generation sequencing,NGS)3。在過(guò)去的十年中,NGS技術(shù)不停的在進(jìn)步——測(cè)序的數(shù)據(jù)量增加了100-1000倍4。這些技術(shù)上的進(jìn)展使得人們甚至可以在一條read上讀出整條基因組序列。根據(jù)Veritas Genomics的數(shù)據(jù)5,人類(lèi)基因組測(cè)序的成本也已經(jīng)下降到1000美元/人。不僅如此,該技術(shù)已經(jīng)廣泛在臨床診斷上得到應(yīng)用3,6。

但是,盡管NGS技術(shù)非常重要,卻并非完美。與NGS技術(shù)一道出現(xiàn)的是該技術(shù)帶來(lái)的一系列問(wèn)題。NGS可以提供海量的數(shù)據(jù)量,但是其質(zhì)量卻有待提高(有報(bào)道,NGS在序列拼接過(guò)程中,錯(cuò)誤率在0.1-15%范圍內(nèi)),并且NGS的序列讀長(zhǎng)普遍較低(每條read的長(zhǎng)度在35-700bp之內(nèi)7,這比普通的Sanger測(cè)序要短),這意味著需要更嚴(yán)格復(fù)雜的序列拼接。盡管長(zhǎng)讀長(zhǎng)測(cè)序可以克服NGS的這一大弱點(diǎn),但相對(duì)而言,成本較高并且通量較低,這也限制了該技術(shù)的進(jìn)一步應(yīng)用。最后,NGS同時(shí)還和其他的技術(shù)之間存在著競(jìng)爭(zhēng)的關(guān)系。

短讀長(zhǎng)(read)的NGS測(cè)序

測(cè)序模版克隆法生成綜述
短讀長(zhǎng)測(cè)序方法包含兩種:邊連接邊測(cè)序(sequencing by ligation, SBL)以及邊合成邊測(cè)序(sequencing by synthesis, SBS)。在SBL方法中,帶有熒光基團(tuán)的探針與DNA片段雜交并且與臨近的寡核糖核酸連接從而得以成像。人們通過(guò)熒光基團(tuán)的發(fā)射波長(zhǎng)來(lái)判斷堿基或者其互補(bǔ)堿基的序列。SBS方法通常使用聚合酶,而且,諸如熒光基團(tuán)在鏈的延伸過(guò)程中被插入其中。絕大多數(shù)的SBL和SBS方法,DNA都是在一個(gè)固體的表面上被克隆。一個(gè)特定區(qū)域內(nèi)成千上萬(wàn)個(gè)拷貝的DNA分子可以增加信號(hào)和背景信號(hào)的區(qū)分度。大量的平行同樣對(duì)上百萬(wàn)的reads的讀取大有幫助,每個(gè)平行只有唯一的DNA模板。一個(gè)測(cè)序平臺(tái)可以同時(shí)從上百萬(wàn)的類(lèi)似反應(yīng)中讀取數(shù)據(jù),因此可以同時(shí)對(duì)上百萬(wàn)的DNA分子進(jìn)行測(cè)序。

產(chǎn)生模板的克隆有幾個(gè)方法:基于磁珠(bead-based),固相介質(zhì)(solid-state)以及DNA微球技術(shù)(DNA nanoball)(圖1)。DNA模板產(chǎn)生的第一步就是樣本DNA的片段化,接著是連接到一個(gè)為了克隆和測(cè)序而設(shè)計(jì)的接頭上。在磁珠法的準(zhǔn)備過(guò)程中,一個(gè)接頭和寡核糖核酸片段互補(bǔ)并且固定在珠子上(圖1a)。DNA模板通過(guò)使用油包水PCR(emulsion PCR,emPCR)8得以擴(kuò)增。單個(gè)珠子上被克隆得到的DNA片段可以達(dá)到上百萬(wàn)個(gè)9。這些珠子可以被分為glass surface10或者PicoTiterPlate(羅氏診斷)11。固相介質(zhì)擴(kuò)增12避免了油包水PCR,取而代之的是在固相介質(zhì)上直接進(jìn)行PCR13(圖1b,c)。該方法中,正向和反向引物結(jié)合在芯片的表面,這些引物給單鏈DNA(single-stranded DNA,ssDNA)提供了末端的互補(bǔ)序列供其結(jié)合。最近,幾個(gè)NGS的平臺(tái)都是用了模塊化的flow cells。

BGI使用的Complete Genomics technology測(cè)序技術(shù)是唯一一個(gè)在溶液中完成模板富集的技術(shù)。在這種情況下,DNA被多次連接,成環(huán)以及剪切從而為了產(chǎn)生一個(gè)包含4個(gè)不同接頭的環(huán)狀的模板。通過(guò)旋轉(zhuǎn)環(huán)狀擴(kuò)增(rolling circle amplification,RCA),可以最多產(chǎn)生超過(guò)200億的DNA微球(圖1d)。微球混合物隨后被分配到芯片表面上,使得每個(gè)微球可以占據(jù)芯片的一個(gè)位點(diǎn)14。


圖1:模板擴(kuò)增策略。


邊連接邊測(cè)序(SOLiD和Complete Genomics)
從根本上來(lái)說(shuō),SBL法包含了雜交和對(duì)標(biāo)記的探針的連接15。探針包含了一到兩個(gè)特定堿基序列和一系列通用序列,這可以使得探針與模板之間進(jìn)行互補(bǔ)配對(duì)。錨定的片段則包含一段已知的和接頭互補(bǔ)的序列用于提供連接位點(diǎn)。連接之后,模板被系統(tǒng)進(jìn)行測(cè)序反應(yīng)16。在錨和探針復(fù)合物或者熒光基團(tuán)被完全移除之后,也或者連接位點(diǎn)重新生成之后,新的循環(huán)又重新開(kāi)始了。

SOLiD平臺(tái)使用的是雙堿基編碼的探針,每個(gè)熒光基團(tuán)信號(hào)代表了一個(gè)二核糖核酸17。因此,原始輸出的數(shù)據(jù)并非直接和已知的核糖核酸相連。因?yàn)橛?6種可能的二核糖核酸組合并不能單獨(dú)結(jié)合熒光基團(tuán)。每四種組合使用一種熒光信號(hào),共有四種熒光信號(hào)。所以,每種連接信號(hào)代表了幾種可能的二核糖核酸組合。SOLiD測(cè)序過(guò)程由一系列的探針-錨的結(jié)合,連接,圖像獲取以及切割的循環(huán)組成。

Complete Genomics使用探針-錨的連接方式(cPAL)或者探針-錨的合成方式(cPAS)來(lái)進(jìn)行測(cè)序14。在cPAL中(圖2b),錨的序列(與四種接頭序列其中之一的互補(bǔ))以及探針雜交到DNA微球的不同位置。每個(gè)循環(huán)中,雜交探針是一組特定位置已知堿基序列的探針的一員。每個(gè)探針包涵一段已知序列的堿基以及對(duì)應(yīng)的熒光基團(tuán)。獲取圖像之后,全部的探針-錨復(fù)合物被移除,新的探針-錨復(fù)合物被雜交。cPAS方法是cPAL的修改版,增加了read的長(zhǎng)度;然而,目前來(lái)說(shuō),該方法還是有局限性的。


圖2: SBL測(cè)序原理。


邊合成邊測(cè)序(Sequencing-by-synthesis)
SBS的方法是指那些依賴(lài)于大量的DNA聚合酶來(lái)進(jìn)行測(cè)序的方法。但是,SBS中依然包括了各種不同的測(cè)序原理。本文中,SBS方法被分為循環(huán)可逆終止(Cyclic reversible termination, CRT)以及單核糖核酸增加(single-nucleotide addition, SNA)18。

邊合成邊測(cè)序:CRT(Illumina,Qiagen)
CRT方法是根據(jù)類(lèi)似于Sanger測(cè)序的終止反應(yīng)來(lái)界定的,其3'-OH基團(tuán)被屏蔽而被阻止繼續(xù)延伸19,20。在反應(yīng)開(kāi)始時(shí),DNA模板被一段和探針序列互補(bǔ)的接頭結(jié)合,DNA聚合酶也是從這段序列開(kāi)始結(jié)合。每個(gè)循環(huán)過(guò)程中,四種單獨(dú)標(biāo)記的復(fù)合物和3'屏蔽的脫氧核糖核酸被添加進(jìn)反應(yīng)中。在延伸過(guò)程中每結(jié)合一個(gè)dNTP,其他沒(méi)有被結(jié)合的dNTPs被移除,并且獲取圖像來(lái)確定是那個(gè)堿基在某個(gè)簇中被結(jié)合。熒光基團(tuán)以及屏蔽基團(tuán)隨后被移除并且開(kāi)始一輪新的反應(yīng)。

Illumina的CRT和其他平臺(tái)相比,代表了最大的測(cè)序平臺(tái)市場(chǎng)。Illumina短讀長(zhǎng)測(cè)序的設(shè)備可以從臺(tái)式的低通量單位到大型的超高通量,如應(yīng)用于全基因組關(guān)聯(lián)分析(whole-genome sequencing,WGS)。dNTPs是通過(guò)兩個(gè)或者四個(gè)激光通道來(lái)對(duì)熒光進(jìn)行分析的。在絕大多數(shù)Illumina平臺(tái)上,每種dNTP結(jié)合一種熒光基團(tuán),因此需要四種不同的激光通道。而NextSeq和Mini-Seq則使用的是雙熒光基團(tuán)系統(tǒng)。


圖3: SBS測(cè)序原理。

2012年,Qiagen獲得了Intelligent BioSystems CRT平臺(tái),并且在2015年將該平臺(tái)命名為GeneReader重新推出并且使之商業(yè)化22(圖3b)。與其他平臺(tái)不同的是,該平臺(tái)打算做一站式的NGS平臺(tái),從樣本制備到數(shù)據(jù)分析,全部一站式解決。為此,GeneReader系統(tǒng)整合了QIAcube樣本制備系統(tǒng)和Qiagen Clinical Insight平臺(tái)用于不同的數(shù)據(jù)分析。GeneReader平臺(tái)的技術(shù)原理與Illumina平臺(tái)基本一致。然而,該平臺(tái)并非讓每個(gè)DNA模板都去結(jié)合帶有熒光基團(tuán)的dNTPs23,而是只要足夠的dNTPs結(jié)合到模板上就可以完成鑒定。


邊合成邊測(cè)序:SNA(454,Ion Torrent)
與CRT不同的是,SNA方法依賴(lài)于單信號(hào)標(biāo)記dNTP來(lái)對(duì)鏈進(jìn)行延伸。四種核糖核酸都必須反復(fù)添加到測(cè)序反應(yīng)過(guò)程中。不僅如此,SNA不需要將dNTP屏蔽,因?yàn)闇y(cè)序反應(yīng)過(guò)程中下一個(gè)堿基的缺失會(huì)阻止鏈的延伸。堿基的寡聚體則是一個(gè)例外,在這種情況下,信號(hào)的強(qiáng)度會(huì)隨著dNTP數(shù)量的增加而成比例的增強(qiáng)。

第一個(gè)NGS儀器是454焦磷酸測(cè)序儀24。這種SNA系統(tǒng)將結(jié)合有模板的珠子以及酶混合物分配到PicoTiterPlate中。由于一個(gè)dNTP只能結(jié)合到一條鏈上,酶復(fù)合物會(huì)對(duì)其產(chǎn)生生物熒光。一個(gè)特定的珠子中的一個(gè)或多個(gè)dNTPs可以通過(guò)電荷共軛偶聯(lián)設(shè)備(charge-coupled device, CCD)檢測(cè)到的熒光來(lái)確認(rèn)(圖4a)。

Ion Torrent是第一個(gè)沒(méi)有光學(xué)感應(yīng)的NGS平臺(tái)25。與酶化學(xué)復(fù)合物產(chǎn)生的信號(hào)相比,Ion Torrent平臺(tái)檢測(cè)的是dNTP中釋放出來(lái)的H離子。pH值的改變通過(guò)(integrated complementary metal-oxide-semiconductor,CMOS)以及(ion-sensitive field-effect transistor,ISFET)來(lái)檢測(cè)(圖4b)。傳感器對(duì)pH的變化對(duì)于連續(xù)堿基的檢測(cè)還不夠完善,因此在測(cè)量同一堿基連續(xù)出現(xiàn)時(shí)的數(shù)量可能會(huì)有所誤差。


圖4: 邊合成邊測(cè)序:?jiǎn)魏颂呛怂崽砑臃ā?/P>



短讀長(zhǎng)平臺(tái)的比較
每個(gè)平臺(tái)在通量,成本,錯(cuò)誤率以及read結(jié)構(gòu)上都大相徑庭(表一)。盡管有多家NGS技術(shù)供應(yīng)商,NGS研究最常用的還是Illumina平臺(tái)21。盡管該平臺(tái)極為穩(wěn)定,數(shù)據(jù)可靠,但是基于其使用的單一測(cè)序的方法26-28,既然具有系統(tǒng)偏好性的問(wèn)題。因此,新技術(shù)的發(fā)展使得研究人員能夠有完整的測(cè)序方案來(lái)獲得完整的序列信息。

SOLiD與Complete Genomics系統(tǒng)使用的SBL技術(shù)準(zhǔn)確率非常高(~99.999%)7,14,因?yàn)槊總(gè)堿基都會(huì)被標(biāo)記多次。雖然這些技術(shù)非常準(zhǔn)確,但是在敏感性與特異性之間依然不能達(dá)到完美的平衡,當(dāng)一些錯(cuò)誤的堿基變化出現(xiàn)時(shí),真實(shí)的堿基變化可能被忽略29-31。該類(lèi)技術(shù)在應(yīng)用上最大的限制可能就是其過(guò)短的讀長(zhǎng)。盡管所有的平臺(tái)都能產(chǎn)生單末端和雙末端的reads,SOLiD的最大讀長(zhǎng)只能達(dá)到75bp,Complete Genomics只能達(dá)到28-100bp33,使得其在基因組拼接和結(jié)構(gòu)變異研究中的可操作性大大降低。不幸的是,SOLiD系統(tǒng)不僅受制于運(yùn)行時(shí)間,還受制于其工業(yè)生產(chǎn)。另外,盡管cPAL計(jì)劃準(zhǔn)備在成本和通量上和Illumina競(jìng)爭(zhēng),卻在2016年被迫下馬,該技術(shù)僅在人類(lèi)WGS中有所應(yīng)用33,34。cPAS的BGISEQ-500系統(tǒng)則受制于中國(guó)大陸政府。

Illumina由于其技術(shù)成熟,平臺(tái)之間高度互補(bǔ)性與交叉性,使得其在短讀長(zhǎng)測(cè)序上大占優(yōu)勢(shì)。Illumina的產(chǎn)品覆蓋了從低通量的Mini-Seq到超高通量的HiSeq X系列,其中HiSeq X系列最多可以在一年內(nèi)產(chǎn)生1800多個(gè)30×覆蓋度的人類(lèi)基因組數(shù)據(jù)量。此外,其運(yùn)行時(shí)間,read結(jié)構(gòu)以及read長(zhǎng)度(最大300bp)都在不停的改進(jìn)。但是,作為一個(gè)依賴(lài)于CRT技術(shù)的Illumina平臺(tái),相對(duì)于SNA平臺(tái)的優(yōu)勢(shì)在于其在讀取核糖核酸多聚體(同一種核糖核酸多次出現(xiàn))時(shí)較低的錯(cuò)誤率。盡管SNA平臺(tái)總體上的準(zhǔn)確率可以達(dá)到99.5%35,但是在讀取那些高AT富集或者高GC富集的片段的時(shí)候錯(cuò)誤率差強(qiáng)人意32,37,38。在2008年,據(jù)Bentley等報(bào)道,Illumina平臺(tái)鑒定到的人類(lèi)單核糖核酸多態(tài)性(SNPs)與基因芯片鑒定的SNPs具有驚人的一致性35。但是,這種高度的敏感性也隨之帶來(lái)了2.5%左右的錯(cuò)誤率。因此,其他小組計(jì)劃使用Sanger測(cè)序來(lái)對(duì)鑒定到的SNPs進(jìn)行重新測(cè)序以便區(qū)分測(cè)序錯(cuò)誤導(dǎo)致的SNPs與真實(shí)的基因突變導(dǎo)致的

SNPs35,39,40。在對(duì)所有的可能性都進(jìn)行優(yōu)化之后,Illumina平臺(tái)被大量的研究人員認(rèn)可,在大量的領(lǐng)域中均有涉及:WGS的基因組測(cè)序與外顯子測(cè)序;遺傳學(xué)應(yīng)用如染色質(zhì)免疫共沉淀——測(cè)序(chromatin immunoprecipitation followed by sequencing)41;ATAC-Seq(transposase-accessible chromatin using sequencing)42或者DNA甲基化測(cè)序(Methyl-Seq)43;RNA轉(zhuǎn)錄組測(cè)序(transcriptomics applications through RNA sequencing, RNA-seq)44等等。NextSeq與MiniDeq平臺(tái)使用的雙色標(biāo)記系統(tǒng)通過(guò)降低雙色通道的掃描與熒光基團(tuán)的使用達(dá)到成本并且增加測(cè)序速度。然而,雙通道系統(tǒng)卻會(huì)略微增加測(cè)序的錯(cuò)誤率45。HiSeq X是目前最高通量的儀器,但其由于通量過(guò)大,因此只在部分應(yīng)用上得以使用,如WGS與全基因組甲基化測(cè)序。不僅如此,HiSeq X更大的局限在于其高昂的成本,以至于超過(guò)了絕大多數(shù)單位的可接受程度。

Qiagen的GeneReader是專(zhuān)為臨床診斷設(shè)計(jì)的,其主要關(guān)注點(diǎn)在腫瘤基因panels46上,也因此其局限性較大。根據(jù)對(duì)其運(yùn)行時(shí)間與功能的分析,GeneReader與Illumina的MiSeq較為相似46。盡管還沒(méi)有使用數(shù)據(jù),但是GeneReader和MiSeq平臺(tái)有相同的優(yōu)缺點(diǎn)。

454平臺(tái)和Ion Torrent平臺(tái)相比于其他的短讀長(zhǎng)平臺(tái)而言,能夠提供較長(zhǎng)的read讀長(zhǎng),分別大約在700bp與400bp,因此在基因組結(jié)構(gòu)較為復(fù)雜的研究上應(yīng)用較多。然而,由于同樣都是基于SNA技術(shù),它們都擁有相同的缺點(diǎn)。雖然,其在非堿基多聚體(non-homopolymer)的測(cè)序上正確率與其它NGS平臺(tái)相差無(wú)幾,但其插入與缺失(Insertion and deletion,indel)是最大的問(wèn)題。同一堿基的多聚體是該類(lèi)技術(shù)最大的問(wèn)題所在。有報(bào)道,對(duì)同一堿基的多聚體的測(cè)序誤差能夠達(dá)到6-8個(gè)堿基之多47,48。不幸的是,盡管Ion Torrent依然在緊跟快速進(jìn)化的NGS平臺(tái)的步伐,454平臺(tái)卻由于成本與應(yīng)用范圍過(guò)于狹小卻已經(jīng)被羅氏公司停產(chǎn)。

Ion Torrent平臺(tái)為不同的研究人員的不同需求提供了不同的芯片與設(shè)備,通量從50Mb到15Gb不等,運(yùn)行時(shí)間也從2小時(shí)到7小時(shí)不等。這一點(diǎn)使得其幾乎是所有目前的二代測(cè)序平臺(tái)中最快的一個(gè)。這也使得其在基因panel與精準(zhǔn)臨床診斷上大有優(yōu)勢(shì)50,包括轉(zhuǎn)錄組與可變剪切鑒定51。Ion Torrent先后發(fā)布Ion Personal Genome Machine (PGM) Dx與Ion S5系列希望于在臨床診斷上打開(kāi)疆土。與Ion Chef文庫(kù)制備試劑盒和芯片上樣設(shè)備結(jié)合使用,S5系列希望能夠成為最方便操作的設(shè)備,消除其它Ion Torrent設(shè)備對(duì)氬的依賴(lài)。但是,其最大的缺點(diǎn)在于Ion PGM Dx系統(tǒng)可以進(jìn)行雙向測(cè)序,更高通量的Ion Proton與S5系統(tǒng)卻并不支持雙向測(cè)序,也因此限制了其在大范圍基因組測(cè)序與轉(zhuǎn)錄組結(jié)構(gòu)上的應(yīng)用。

長(zhǎng)讀長(zhǎng)(read)的NGS測(cè)序
綜述

基因組是一個(gè)復(fù)雜的復(fù)合物,其中包含了多種重復(fù)序列,拷貝數(shù)變化,結(jié)構(gòu)變異。這些與進(jìn)化,適應(yīng)以及疾病密切相關(guān)54-56。然而,許多復(fù)合物元件由于過(guò)長(zhǎng),導(dǎo)致短讀長(zhǎng)測(cè)序并不能夠完美的對(duì)其進(jìn)行測(cè)序。長(zhǎng)讀長(zhǎng)測(cè)序的reads可以達(dá)到幾千個(gè)堿基,這使得可以對(duì)大的結(jié)構(gòu)進(jìn)行功能解析。此類(lèi)的長(zhǎng)讀長(zhǎng)測(cè)序產(chǎn)生的單一長(zhǎng)序列可以跨越復(fù)合物或者重復(fù)序列。長(zhǎng)讀長(zhǎng)測(cè)序在轉(zhuǎn)錄組測(cè)序過(guò)程中也大有益處,因?yàn)殚L(zhǎng)讀長(zhǎng)的reads可以跨越完整的mRNA的轉(zhuǎn)錄本而不需要拼接。這可以使得研究人員可以鑒定到更多的基因亞型等。

最近,人們開(kāi)發(fā)出了兩種長(zhǎng)讀長(zhǎng)測(cè)序的實(shí)驗(yàn)方案,分別是:?jiǎn)畏肿訉?shí)時(shí)測(cè)序(single-molecule real-time sequencing )以及依賴(lài)于已有短讀長(zhǎng)技術(shù)體外構(gòu)建長(zhǎng)讀長(zhǎng)的合成法。單分子法與短讀長(zhǎng)測(cè)序完全不同,因?yàn)閱畏肿臃ú恍枰獙?duì)模板進(jìn)行擴(kuò)增來(lái)產(chǎn)生足夠測(cè)序儀讀取的信號(hào),也不需要輪番添加dNTP。而合成法并非產(chǎn)生原始的長(zhǎng)讀長(zhǎng)的reads,而是通過(guò)利用barcodes來(lái)進(jìn)行拼接獲得長(zhǎng)片段。

表一:NGS平臺(tái)概述。





單分子長(zhǎng)讀長(zhǎng)測(cè)序(PacBio和ONT)
最近這段時(shí)間,最常用的長(zhǎng)讀長(zhǎng)測(cè)序法平臺(tái)就是使用PacBio Biosciences(PacBio)57的單分子實(shí)時(shí)測(cè)序法(single-molecule real-time sequencing, SMRT)(圖5a)。該設(shè)備使用了一個(gè)特制的流動(dòng)單元,其中包含了成千上萬(wàn)的單獨(dú)的底部透明的皮升孔(picolitre wells)——zero-mode waveguides(ZMW)58。短讀長(zhǎng)SBS技術(shù)需要使得聚合酶結(jié)合DNA,沿著DNA進(jìn)行擴(kuò)增,而PacBio則固定聚合酶在空的底部,讓DNA鏈通過(guò)ZMW。由于有聚合酶有固定的位置,因此該系統(tǒng)可以對(duì)單分子DNA進(jìn)行測(cè)序。dNTP結(jié)合在每個(gè)孔的單分子模板上,通過(guò)激光或者成像設(shè)備記錄ZMW底部標(biāo)記在核糖核酸上的發(fā)射波長(zhǎng)的顏色與持續(xù)時(shí)間來(lái)進(jìn)行序列的讀取。聚合酶在結(jié)合dNTPs的過(guò)程中,切割dNTP結(jié)合的熒光基團(tuán),使得熒光基團(tuán)在第二個(gè)標(biāo)記的堿基進(jìn)入ZMW前將前一個(gè)熒光基團(tuán)去除。SMRT平臺(tái)也使用了獨(dú)特的環(huán)狀模板,這種方式的模板可以使得聚合酶反復(fù)讀取模板的序列。盡管這種方法不太容易對(duì)長(zhǎng)度大于3kb的片段反復(fù)讀取,但是短的模板卻可以反復(fù)讀取多次57,59。由于多次讀取同一序列,因此系統(tǒng)會(huì)產(chǎn)生多次測(cè)序后的保守序列(consensus sequence, CCS)。
 
2014年,第一個(gè)消費(fèi)級(jí)別的nanopore測(cè)序儀的原型機(jī)——MinION在Oxford Nanopore Technologies(ONT)誕生。與其他平臺(tái)不同的是,nanopore測(cè)序儀并不監(jiān)測(cè)模板DNA結(jié)合或雜交的核糖核酸。其它平臺(tái)通過(guò)監(jiān)測(cè)次級(jí)信號(hào),光,顏色或pH等來(lái)進(jìn)行堿基序列的讀取,二nanopore則直接對(duì)天然的ssDNA分子進(jìn)行讀取。為達(dá)成此,DNA需要通過(guò)一個(gè)蛋白孔(protein pore)(圖5b),孔也會(huì)因?yàn)镈NA分子的通過(guò)導(dǎo)致的電壓阻塞(voltage blockade)的發(fā)生。對(duì)這些電荷瞬時(shí)的追蹤稱(chēng)為squiggle space,特定DNA序列通過(guò)孔會(huì)產(chǎn)生特定的電壓改變,這被稱(chēng)為k-mer。相比于1-4種可能的信號(hào),nanopore擁有1000多種可能的k-mer,尤其是當(dāng)天然DNA序列中存在修飾的堿基的時(shí)候。最近的MK1 MinION流動(dòng)單元由特殊應(yīng)用的芯片組成,包涵了512個(gè)獨(dú)立的通道,每秒可以讀取70bp長(zhǎng)度,到2016年預(yù)計(jì)能夠增加到500bp/秒。新推出的PromethION設(shè)備是包含了48個(gè)獨(dú)立流動(dòng)單元的高通量平臺(tái)。該項(xiàng)工作最多可以在2天內(nèi)輸出~2-4Tb的數(shù)據(jù)量,這使可能其成為HiSeq X系列的強(qiáng)力競(jìng)爭(zhēng)者。與PacBio的環(huán)狀模板類(lèi)似的是,ONT MinION使用一個(gè)leader-harpin library結(jié)構(gòu)。這使得正向DNA鏈可以通過(guò)孔,接著harpin蛋白結(jié)合雙鏈,最后是反義鏈。這產(chǎn)生了1D和2D reads,1D鏈可以通過(guò)比對(duì)產(chǎn)生一個(gè)保守的2D read。

圖5: 長(zhǎng)讀長(zhǎng)實(shí)時(shí)測(cè)序原理。



長(zhǎng)reads的合成

與真正測(cè)序的平臺(tái)不同的是,合成長(zhǎng)讀長(zhǎng)技術(shù)依賴(lài)于一個(gè)barcode系統(tǒng)來(lái)結(jié)合不同的片段,通過(guò)已有的短讀長(zhǎng)測(cè)序儀來(lái)獲得長(zhǎng)讀長(zhǎng)reads61。該方法將大的DNA分子分割成若干個(gè)小片段到微孔中或者乳液中。每個(gè)微孔或者乳液中的模板被切割并且加上了barcodes。這種方法允許在短讀長(zhǎng)測(cè)序儀上使用,測(cè)序后數(shù)據(jù)被通過(guò)barcode分開(kāi)按照barcodes的序列進(jìn)行拼接62。

合成法有兩個(gè)系統(tǒng):Illumina長(zhǎng)片段合成平臺(tái)(圖5c)與10X Genomics乳液系統(tǒng)(圖5d)。Illumina系統(tǒng)(Moleculo)分割DNA到小板上而不需要特殊儀器。然而,10X Genomics乳液系統(tǒng)(GemCode與Chromium)使用乳液分隔DNA并且需要微流體平臺(tái)(microfluidic instrument)來(lái)進(jìn)行測(cè)序前的準(zhǔn)備工作。在其實(shí)濃度低至1ng的情況下,10X Genomics乳液系統(tǒng)可以任意切割長(zhǎng)的DNA片段(最大達(dá)到100kb)到微粒(GEM)中,這種威力一般包含了≤0.3× 的基因組以及一個(gè)獨(dú)特的barcode。

單分子測(cè)序與合成法測(cè)序的比較
人們對(duì)長(zhǎng)讀長(zhǎng)測(cè)序越來(lái)越感興趣,每個(gè)系統(tǒng)都有其優(yōu)劣(表一)。最近長(zhǎng)讀長(zhǎng)測(cè)序最受歡迎的是PacBioRS II。該設(shè)備可以產(chǎn)生超過(guò)50kb長(zhǎng)度的單個(gè)read,長(zhǎng)鏈建庫(kù)測(cè)序平均長(zhǎng)度為10-15kb。這種特性使得在基因組拼接與大范圍基因組結(jié)構(gòu)的應(yīng)用中大有好處63,64。但是,長(zhǎng)鏈的單個(gè)堿基錯(cuò)誤率在15%左右65,使得人們對(duì)該儀器的使用有所顧慮66。不幸的是,這些錯(cuò)誤隨機(jī)分布每個(gè)reads,也因此必須有足夠高的覆蓋度來(lái)消除單個(gè)堿基錯(cuò)誤率的負(fù)面影響67。

PacBio的環(huán)狀模板有時(shí)候也會(huì)出現(xiàn)錯(cuò)誤。單個(gè)堿基測(cè)序次數(shù)越多,結(jié)果就越可靠,其最高準(zhǔn)確率達(dá)到99.999%59,68。其高準(zhǔn)確率與Sanger測(cè)序相似,使得該方法與Sanger測(cè)序一道成為SNPs的研究方法65。該設(shè)備的運(yùn)行時(shí)間與通量受測(cè)序讀長(zhǎng)的影響,長(zhǎng)的模板需要更長(zhǎng)的時(shí)間。舉例來(lái)說(shuō),1kb的庫(kù)運(yùn)行1小時(shí)測(cè)序每個(gè)分子可以產(chǎn)生7500個(gè)堿基,平均大約重復(fù)8次;而運(yùn)行4小時(shí)每個(gè)分子可以產(chǎn)生大約30000個(gè)堿基(大約重復(fù)30次)。相反的是,10kb的庫(kù)運(yùn)行4小時(shí)產(chǎn)生30000個(gè)堿基只能重復(fù)3次左右。通量的限制以及高企的成本(1000美元/G),加上較高的覆蓋度使得PacBio RS II成為那些較小的實(shí)驗(yàn)室難以應(yīng)用的技術(shù)。然而,考慮到這些問(wèn)題,PacBio推出了Sequel系統(tǒng),其通量與RS II相比高出了7倍,使得30×覆蓋度的人類(lèi)基因組測(cè)序成本大幅下降一半69。

ONT MinION是一個(gè)小的(~3 cm× 10 cm)USB設(shè)備,并且可以在個(gè)人電腦上運(yùn)行,使得其成為最小的測(cè)序平臺(tái)。這使得MinION具有極高的便攜性,并且在臨床診斷中以及那些不容易到達(dá)的地方有著廣泛的應(yīng)用前景。盡管周邊設(shè)備依然只有在實(shí)驗(yàn)室中才有,如文庫(kù)準(zhǔn)備的恒溫器,這依然可以大幅減少設(shè)備空間。與其他平臺(tái)不同,MinION在片段大小上是有限制的。理論上來(lái)講,任意大小的DNA分子都可以在該設(shè)備上測(cè)序,但是實(shí)際情況是在對(duì)長(zhǎng)片段進(jìn)行測(cè)序過(guò)程中,是有所制約的70。作為ONT技術(shù)本身的特性,ONT擁有超過(guò)1000種獨(dú)立的信號(hào),這使得ONT擁有巨大的錯(cuò)誤率——1D read大約在30%左右(主要是indel)。有效的對(duì)核糖核酸復(fù)合物的測(cè)序也是ONT MinION面臨的一大問(wèn)題。當(dāng)核糖核酸復(fù)合物超過(guò)k-mer長(zhǎng)度,就很難準(zhǔn)確鑒定前一個(gè)k-mer何時(shí)離開(kāi)孔而下一個(gè)k-mer何時(shí)進(jìn)入孔。因?yàn)樾揎椀膲A基會(huì)改變?cè)械膋-mer設(shè)定的電壓變化,所以堿基的修飾對(duì)MinION而言同樣也是一大挑戰(zhàn)。幸運(yùn)的是,最近的一系列的對(duì)試劑以及算法的改進(jìn)使得其準(zhǔn)確率提高不少71。

應(yīng)用

WGS正在成為NGS中最廣泛的應(yīng)用。通過(guò)該技術(shù)并且結(jié)合生物學(xué)應(yīng)用,研究人員可以獲得基因組信息中最值得注意的信息73。舉例來(lái)說(shuō),2012年,Ellis等報(bào)道了基因與乳腺癌患者芳香酶抑制劑(aromatase inhibitor)治療法之間的關(guān)聯(lián)。他們指出突變,后果與診斷之間的關(guān)聯(lián),同樣還有癌癥相關(guān)基因的突變的富集。這提供了一個(gè)可能性,即:乳腺癌有不同的突變?cè)斐刹煌谋硇,具有?fù)雜的病理學(xué)75。最近的NGS平臺(tái)的改進(jìn)使得研究人員發(fā)現(xiàn)了一些幾年前難以想象的新觀點(diǎn)與機(jī)會(huì)。在2010年,1000基因組計(jì)劃(1000 genomes project)開(kāi)放了其從179個(gè)個(gè)體中獲得的WGS原始數(shù)據(jù)以及697個(gè)個(gè)體的測(cè)序數(shù)據(jù)76。到2015年,研究人員已經(jīng)構(gòu)建了26個(gè)不同人群的2504個(gè)人的基因組群體77,78。給人們從種群的角度來(lái)觀察人類(lèi)的變異。但這還不是該項(xiàng)目的終點(diǎn),越來(lái)越多的人的基因組正在被得以測(cè)序79-81。種群水平的測(cè)序已經(jīng)成為人們更好的理解人類(lèi)疾病的一個(gè)重要的工具,同樣也得到了意想不到的結(jié)果。一個(gè)例子是,Sidore等82對(duì)2120個(gè)撒丁島人(Sardinians)的WGS研究發(fā)現(xiàn)了一些新的和脂肪相關(guān)的基因以及炎癥的標(biāo)志物,給人們對(duì)血液膽固醇的分子機(jī)制的研究提供了新思路。

全外顯子組測(cè)序(Whole-exome and targeted sequencing)83同樣也廣泛應(yīng)用于測(cè)序的研究中。受制于基因組材料大小的局限,很更多的個(gè)人樣本可以在一個(gè)測(cè)序中實(shí)現(xiàn),增加了基因組研究的寬度以及深度。使用外顯子測(cè)序,Iossifov84等對(duì)超過(guò)2500個(gè)單一的家庭進(jìn)行測(cè)序,每個(gè)家庭都有一個(gè)小孩患有自閉癥(autism spectrum disorder, ASD)。研究人員在30%的樣本中發(fā)現(xiàn)了錯(cuò)意突變(missense mutations),基因干擾的突變(gene-disrupting mutations)以及拷貝數(shù)的變異。該工作與其他的工作一道鑒定到了ASD相關(guān)的基因突變85,86。其他證據(jù)表明,高覆蓋度的WGS也可以解決復(fù)雜的變異以及臨床樣本的分析。2015年,Griffith等認(rèn)為可以使用一個(gè)完美的跨平臺(tái)的方法(包含靶向測(cè)序)來(lái)鑒定腫瘤中高可信度的SNPs。該方法中,作者認(rèn)為10000×的覆蓋度可以鑒定到稀有突變。由于10000×的覆蓋度對(duì)于WGS而言實(shí)在過(guò)高,靶向測(cè)序便在臨床中得到了廣泛的應(yīng)用。

 NGS同樣在基因的調(diào)控研究中有廣泛的應(yīng)用。蛋白-DNA互作可以通過(guò)染色質(zhì)免疫共沉淀結(jié)合NGS測(cè)序(ChIP-seq)來(lái)得以研究41。利用NGS對(duì)修飾堿基的研究也是可行的。舉例來(lái)說(shuō),甲基化測(cè)序包含了甲基化DNA的捕獲與富集88,對(duì)甲基化與非甲基化區(qū)段的選擇性消化89,90,91。但是,盡管利用此方法獲得了很多重大的發(fā)現(xiàn),修飾與捕獲過(guò)程成為其最大的限制。2010年,F(xiàn)lusberg等92發(fā)表了一個(gè)概念性的研究方法,即:使用PacBio來(lái)區(qū)分甲基化與非甲基化的堿基。由于聚合酶即便是甲基化的堿基也能夠延伸,但在甲基化位點(diǎn)上會(huì)停留更多的時(shí)間,因此這里改變的信號(hào)可以認(rèn)為含有甲基化修飾。與之相同的是,nanopore平臺(tái)也能夠監(jiān)測(cè)修飾的堿基,因?yàn)榧谆瑯訒?huì)影響鑒定到的電壓的變化。這使得甲基化的測(cè)序可以在不需要化學(xué)操作的條件下進(jìn)行93。

一個(gè)最近的NGS的范例是對(duì)長(zhǎng)鏈DNA的測(cè)序。重復(fù)序列以及復(fù)合序列長(zhǎng)久以來(lái)較難以拼接,短讀長(zhǎng)測(cè)序很難解決這個(gè)問(wèn)題94-96。最近,Chaisson等97對(duì)長(zhǎng)讀長(zhǎng)測(cè)序的使用使得其能夠在人類(lèi)GRCh37數(shù)據(jù)庫(kù)中提交超過(guò)1Mb的新的序列,這些序列彌補(bǔ)甚至跨越了曾經(jīng)的溝。Chaisson等還鑒定到了大于26000個(gè)超過(guò)50bp的indels,也因此,GRCh37數(shù)據(jù)庫(kù)成為最有參考價(jià)值的幾個(gè)基因組之一。除了簡(jiǎn)單的增加基因組數(shù)據(jù)可靠性之外,長(zhǎng)讀長(zhǎng)還能夠提供更有效的臨床診斷98-100。

在對(duì)轉(zhuǎn)錄水平上的研究也因?yàn)镹GS受益匪淺。今天,研究人員甚至能夠使用NGS的深度測(cè)序?qū)蝹(gè)轉(zhuǎn)錄本進(jìn)行研究。2014年,Treutlein等101使用了組織發(fā)育過(guò)程中不同細(xì)胞類(lèi)群的單細(xì)胞RNA測(cè)序發(fā)現(xiàn)了用于鑒定細(xì)胞亞群的標(biāo)志物。盡管長(zhǎng)讀長(zhǎng)測(cè)序相對(duì)而言在對(duì)轉(zhuǎn)錄本的定量上不占優(yōu)勢(shì),但是,長(zhǎng)讀長(zhǎng)可以在研究轉(zhuǎn)錄組的結(jié)構(gòu)上有所幫助51。舉例來(lái)說(shuō),最近的人類(lèi)長(zhǎng)讀長(zhǎng)轉(zhuǎn)錄組測(cè)序研究表明 >10%的reads是新的可變剪切體102。

 NGS最新的設(shè)備——nanopore測(cè)序儀,依然在尋找其定位的過(guò)程中。然而,研究人員正在將其快速的文庫(kù)制備,實(shí)時(shí)的數(shù)據(jù)生產(chǎn)以及小的體積的優(yōu)勢(shì)轉(zhuǎn)變?yōu)橘Y本過(guò)程中。最近,英國(guó)Stanley Royd Hospital的研究人員使用MinION用于監(jiān)測(cè)沙門(mén)氏菌(Salmonella enterica)的爆發(fā)103。MinION測(cè)序儀最令人振奮的應(yīng)用可能就是2014年的埃博拉病毒爆發(fā)104。在位于日內(nèi)瓦的歐洲移動(dòng)實(shí)驗(yàn)室的主持下,作者對(duì)埃博拉病毒的傳播以及進(jìn)化歷史進(jìn)行了深入的研究。

結(jié)尾
我們正處在新的NGS技術(shù)革命的頂端。NGS現(xiàn)在已經(jīng)不僅僅只是一個(gè)新奇的事物,而已經(jīng)成為了一個(gè)在生物學(xué)研究中廣泛應(yīng)用的技術(shù)。最新的超高通量測(cè)序儀已經(jīng)將曾經(jīng)認(rèn)為不可能的事情成為可能。這包含了首創(chuàng)的精準(zhǔn)醫(yī)療(medicine initiatives)以及Illumina計(jì)劃的對(duì)循環(huán)腫瘤DNA(circulating tumour DNA, ctDNA)進(jìn)行測(cè)序。每個(gè)計(jì)劃都對(duì)數(shù)萬(wàn)個(gè)基因組樣本進(jìn)行測(cè)序。所以,快速以及低成本的測(cè)序給予了內(nèi)科醫(yī)生強(qiáng)大的工具來(lái)翻譯基因組信息成為有用的臨床診斷結(jié)果。

這個(gè)革命也帶來(lái)了新的挑戰(zhàn)。由于NGS旨在廣泛的應(yīng)用于臨床,時(shí)間就成為一個(gè)NGS首先需要面對(duì)的挑戰(zhàn)。對(duì)于那些嚴(yán)重的神經(jīng)性疾病或者極為危險(xiǎn)的癌癥患者而言,數(shù)周的WGS分析的等待時(shí)間足以使的患者錯(cuò)過(guò)最佳的治療時(shí)間。對(duì)于急性感染而言,這些事件已經(jīng)下降到幾天。盡管人們已經(jīng)對(duì)時(shí)間做出了巨大的改進(jìn),但是絕大多數(shù)現(xiàn)有的系統(tǒng)都不能完全滿(mǎn)足快速模式下的足夠產(chǎn)出。

雖然臨床診斷面臨著數(shù)據(jù)量不夠的問(wèn)題,NGS其他方面的應(yīng)用卻面臨著生產(chǎn)力過(guò)剩的境地。目前,已有超過(guò)14000個(gè)基因組序列上傳到US National Center for Biotechnology Information(NCBI)中。2013年,Schatz與Langmead報(bào)道了全世界每年可以生產(chǎn)超過(guò)15pb的數(shù)據(jù)量,并且數(shù)量與通量依然在繼續(xù)增加107。數(shù)據(jù)量的富余對(duì)分析以及其下游提出了嚴(yán)峻的挑戰(zhàn),這需要革命性的存儲(chǔ)與生信解決方案108。將海量的數(shù)據(jù)量翻譯成有生物學(xué)與遺傳學(xué)內(nèi)涵的結(jié)果同樣也是一個(gè)挑戰(zhàn)87,109,110。在臨床診斷方面,通過(guò)NGS分析的數(shù)據(jù)產(chǎn)生的假陽(yáng)性或者假陰性同樣也是需要慎重考慮的問(wèn)題111,112。

最近,Illumina由于NGS與其周邊產(chǎn)品獲得了巨大的成功。其它生產(chǎn)商也在快速革新自身的產(chǎn)品113。Illumina的市場(chǎng)仍然在增長(zhǎng),以至于優(yōu)勢(shì)巨大。BGISEQ-500以及Helicos technology的GenoCare114在亞洲也有所斬獲。ONT PromethION115與Illumina HiSeq X系列則向著成本與產(chǎn)量的極限大步邁進(jìn)。隨著人們對(duì)臨床診斷測(cè)序興趣的增加,已有的NGS供應(yīng)商正在提供各種快速的解決方案,如Ion Torrent S5以及Illumina的MiniSeq,還有新加入者Qiagen的GeneReader也來(lái)參與競(jìng)爭(zhēng)。

今后的幾年里,更多的玩家也會(huì)帶著心得解決方案進(jìn)入這個(gè)市場(chǎng)。GenapSys (Sigma-Aldrich)的electronic ‘lunchbox’-sized sequencer116; Genia (Roche)的新的nanopore測(cè)序方案117; 以及單通道CMOS技術(shù)118,都號(hào)稱(chēng)能夠在臨床應(yīng)用上節(jié)約足夠的時(shí)間。這些已有的和新的攪局者都有著科技革命的潛質(zhì),包括直接對(duì)RNA或者蛋白進(jìn)行測(cè)序等,這些最近和未來(lái)的進(jìn)步使得今天成為NGS發(fā)展的黃金時(shí)期。

參考文獻(xiàn)
1. Watson, J. D. & Crick, F. H. The structure of DNA. Cold Spring Harb. Symp. Quant. Biol. 18, 123–131 (1953).
2. Mardis, E. R. Next-generation sequencing platforms. Annu. Rev. Anal. Chem. (Palo Alto Calif.) 6, 287–303 (2013).
This article provides a concise description of technological advancements supporting NGS.
3. Wetterstrand, K. A. DNA sequencing costs: data from the NHGRI Genome Sequencing Program (GSP). National Human Genome Research Institute [online], http://www.genome.gov/sequencingcosts (updated 15 Jan 2016).
4. Kircher, M. & Kelso, J. High-throughput DNA sequencing — concepts and limitations. Bioessays 32, 524–536 (2010).
5. Veritas Genetics. Veritas genetics launches $999 whole genome and sets new standard for genetic testing — Press Release. Veritas Genetics [online], https:// www.veritasgenetics.com/documents/VG-launches-999- whole-genome.pdf (updated 4 Mar 2016).
6. Veritas Genetics. Veritas genetics breaks $1,000 whole genome barrier — Press Release. Veritas Genetics [online], https://www.veritasgenetics.com/documents/ VG-PGP-Announcement-Final.pdf (29 Sep 2015).
7. Liu, L. et al. Comparison of next-generation sequencing systems. J. Biomed. Biotechnol. 2012, 251364 (2012).
8. Dressman, D., Yan, H., Traverso, G., Kinzler, K. W. & Vogelstein, B. Transforming single DNA molecules
into fluorescent magnetic particles for detection and enumeration of genetic variations. Proc. Natl Acad. Sci. USA 100, 8817–8822 (2003).
9. Shendure, J. et al. Accurate multiplex polony sequencing of an evolved bacterial genome. Science 309, 1728–1732 (2005).
10. Kim, J. B. et al. Polony multiplex analysis of gene expression (PMAGE) in mouse hypertrophic cardiomyopathy. Science 316, 1481–1484 (2007).
11. Leamon, J. H. et al. A massively parallel PicoTiterPlate based platform for discrete picoliter-scale polymerase chain reactions. Electrophoresis 24, 3769–3777 (2003).
12. Fedurco, M., Romieu, A., Williams, S., Lawrence, I. & Turcatti, G. BTA, a novel reagent for DNA attachment on glass and efficient generation of solid-phase amplified DNA colonies. Nucleic Acids Res. 34, e22 (2006).
13. Harris, T. D. et al. Single-molecule DNA sequencing of a viral genome. Science 320, 106–109 (2008).
14. Drmanac, R. et al. Human genome sequencing using unchained base reads on self-assembling DNA nanoarrays. Science 327, 78–81 (2010).
This paper describes the use of DNA nanoballs to achieve clonal amplification and the use of cPAL to achieve human genome sequencing as implemented by Complete Genomics (BGI).
15. Tomkinson, A. E., Vijayakumar, S., Pascal, J. M. & Ellenberger, T. DNA ligases: structure, reaction mechanism, and function. Chem. Rev. 106, 687–699 (2006).
16. Landegren, U., Kaiser, R., Sanders, J. & Hood, L.
A ligase-mediated gene detection technique. Science 241, 1077–1080 (1988).
17. Valouev, A. et al. A high-resolution, nucleosome position map of C. elegans reveals a lack of universal sequence-dictated positioning. Genome Res. 18, 1051–1063 (2008).
This paper describes the use of cleavable two-base-encoded probes to achieve genome-wide nucleosome mapping in Caenorhabditis elegans. This technology is implemented by Applied Biosystems (Thermo Fisher) for the SOLiD platform.
18. Metzker, M. L. Sequencing technologies — the next generation. Nat. Rev. Genet. 11, 31–46 (2010).
19. Ju, J. et al. Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators. Proc. Natl Acad. Sci. USA 103, 19635–19640 (2006).
20. Guo, J. et al. Four-color DNA sequencing with 3ʹ-O-modified nucleotide reversible terminators and chemically cleavable fluorescent dideoxynucleotides. Proc. Natl Acad. Sci. USA 105, 9145–9150 (2008).
21. Timmerman, L. DNA sequencing market will exceed $20 billion, says Illumina CEO Jay Flatley.Forbes [online], http://www.forbes.com/sites/ luketimmerman/2015/04/29/qa-with-jay-flatley-ceo- of-illumina-the-genomics-company-pursuing-a-20b- market/#4dbd19943bf5 (29 Apr 2015).
22. Karow, J. Qiagen launches GeneReader NGS System at AMP; presents performance evaluation by broad. GenomeWeb [online], https://www.genomeweb.com/ molecular-diagnostics/qiagen-launches-genereader- ngs-system-amp-presents-performance-evaluation (4 Nov 2015).
23. Smith, D. R. & McKernan, K. Methods of producing and sequencing modified polynucleotides. US Patent 8058030 (2011).
24. Margulies, M. et al. Genome sequencing in microfabricated high-density picolitre reactors. Nature 437, 376–380 (2005).
This paper describes the development of the
first NGS technology through the use of pyrosequencing. The authors demonstrate this method through sequencing of the Mycoplasma genitalium genome.
25. Rothberg, J. M. et al. An integrated semiconductor device enabling non-optical genome sequencing. Nature 475, 348–352 (2011).
This paper describes the first non-optical sequencing technology using a massively parallel semi-conductor device to monitor H+ release during DNA synthesis, as implemented by the Ion Torrent platform (Thermo Fisher). The authors demonstrate this technology by sequencing both bacterial and human DNA.
26. Rieber, N. et al. Coverage bias and sensitivity of variant calling for four whole-genome sequencing technologies. PLoS ONE 8, e66621 (2013).
27. Zook, J. M. et al. Integrating human sequence data sets provides a resource of benchmark SNP and indel genotype calls. Nat. Biotechnol. 32, 246–251 (2014).
28. Nothnagel, M. et al. Technology-specific error signatures in the 1000 Genomes Project data. Hum. Genet. 130, 505–516 (2011).
29. Shen, Y. Sarin, S., Liu, Y., Hobert, O. & Pe’er, I. Comparing platforms for C. elegans mutant identification using high-throughput whole-genome sequencing. PLoS ONE 3, e4012 (2008).
30. Chan, M. et al. Development of a next-generation sequencing method for BRCA mutation screening:
a comparison between a high-throughput and a benchtop platform. J. Mol. Diagnost. 14, 602–612 (2012).
31. Wall, J. D. et al. Estimating genotype error rates from high-coverage next-generation sequence data. Genome Res. 24, 1734–1739 (2014).
32. Harismendy, O. et al. Evaluation of next generation sequencing platforms for population targeted sequencing studies. Genome Biol. 10, R32 (2009).
33. BGI. Revolocity Whole Genome Sequencing Service — Press Release. BGI [online], http:// u70g92ptbyk941g21dd41fc4.wpengine.netdna- cdn.com/wp-content/uploads/2015/10/Global- WGSRevolocity-ENG-10-15.pdf (2015).
34. Karow, J. BGI halts revolocity launch, cuts complete genomics staff as part of strategic shift. GenomeWeb [online], https://www.genomeweb.com/sequencing- technology/bgi-halts-revolocity-launch-cuts-complete- genomics-staff-part-strategic-shift (23 Nov 2015).
35. Bentley, D. R. et al. Accurate whole human genome sequencing using reversible terminator chemistry. Nature 456, 53–59 (2008).
This paper demonstrates the use of reversible dye-terminator chemistry for human genome sequencing. This platform is used by the Illumina suite of platforms.
36. Dohm, J. C., Lottaz, C., Borodina, T. &
Himmelbauer, H. Substantial biases in ultra-short read data sets from high-throughput DNA sequencing. Nucleic Acids Res. 36, e105 (2008).
37. Nakamura, K. et al. Sequence-specific error profile of Illumina sequencers. Nucleic Acids Res. 39, e90 (2011).
38. Minoche, A. E., Dohm, J. C. & Himmelbauer, H. Evaluation of genomic high-throughput sequencing data generated on Illumina HiSeq and genome analyzer systems. Genome Biol. 12, R112 (2011).
39. Ley, T. J. et al. DNA sequencing of a cytogenetically normal acute myeloid leukaemia genome. Nature 456, 66–72 (2008).
40. Sarin, S., Prabhu, S., O’Meara, M. M., Pe’er, I. & Hobert, O. Caenorhabditis elegans mutant allele identification by whole-genome sequencing. Nat. Methods 5, 865–867 (2008).
41. Park, P. J. ChIP–seq: advantages and challenges of a maturing technology. Nat. Rev. Genet. 10, 669–680 (2009).
This review provides an overview of ChIP–seq methods for detecting chromatin–DNA interactions and their importance to epigenetics research.
42. Buenrostro, J. D., Giresi, P. G., Zaba, L. C., Chang, H. Y. & Greenleaf, W. J. Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position. Nat. Methods 10, 1213–1218 (2013).
43. Brunner, A. L. et al. Distinct DNA methylation patterns characterize differentiated human embryonic stem cells and developing human fetal liver. Genome Res. 19, 1044–1056 (2009).
44. Wang, Z., Gerstein, M. & Snyder, M. RNA-Seq:
a revolutionary tool for transcriptomics. Nat. Rev. Genet. 10, 57–63 (2009).
This review provides an overview of advances and challenges in techniques that are used in transcriptomic research with a specific focus in methods that use NGS technologies.
45. Wang, X. et al. A trimming-and-retrieving alignment scheme for reduced representation bisulfite sequencing. Bioinformatics 31, 2040–2042 (2015).
46. Qiagen. Oncology insights enabled by knowledge base- guided panel design and the seamless workflow of the GeneReader NGS system — Press Release. Qiagen [online], http://www.genereaderngs.com/PROM-9192- 001_1100403_WP_GeneReader_NGS_0116_NA.pdf (2016).
47. Forgetta, V. et al. Sequencing of the Dutch elm disease fungus genome using the Roche/454 GS-FLX Titanium System in a comparison of multiple genomics core facilities. J. Biomol. Tech. 24, 39–49 (2013).
48. Loman, N. J. et al. Performance comparison of benchtop high-throughput sequencing platforms. Nat. Biotechnol. 30, 434–439 (2012).
49. GenomeWeb. Roche shutting down 454 sequencing business. GenomeWeb [online], https://www. genomeweb.com/sequencing/roche-shutting-down- 454-sequencing-business (15 Oct 2015).
50. Malapelle, U. et al. Ion Torrent next-generation sequencing for routine identification of clinically relevant mutations in colorectal cancer patients. J. Clin. Pathol. 68, 64–68 (2015).
51. Li, S. et al. Multi-platform assessment of transcriptome profiling using RNA-seq in the ABRF next-generation sequencing study. Nat. Biotechnol. 32, 915–925 (2014).
52. Life Technologies. Ion semiconductor sequencing uniquely enables both accurate long reads and paired- end sequencing. Life Technologies [online], https:// www3.appliedbiosystems.com/cms/groups/applied_ markets_marketing/documents/generaldocuments/ cms_098680.pdf (2011)
53. Campbell, P. J. et al. Identification of somatically acquired rearrangements in cancer using genome-wide massively parallel paired-end sequencing. Nat. Genet. 40, 722–729 (2008).
54. McCarroll, S. A. & Altshuler, D. M. Copy-number variation and association studies of human disease. Nat. Genet. 39, S37–S42 (2007).
55. Mirkin, S. M. Expandable DNA repeats and human disease. Nature 447, 932–940 (2007).
56. Stankiewicz, P. & Lupski, J. R. Structural variation in the human genome and its role in disease. Annu. Rev. Med. 61, 437–455 (2010).
57. Eid, J. et al. Real-time DNA sequencing from single polymerase molecules. Science 323, 133–138 (2009).
The authors describe the development of a real-time sequencing method using their zero-mode waveguide sensors as implemented by the Pacific Biosciences platform. The authors demonstrate the technique by sequencing synthetic DNA templates.
58. Levene, M. J. et al. Zero-mode waveguides for single- molecule analysis at high concentrations. Science 299, 682–686 (2003).
59. Loomis, E. W. et al. Sequencing the unsequenceable: expanded CGG-repeat alleles of the fragile X gene. Genome Res. 23, 121–128 (2013).
60. Clarke, J. et al. Continuous base identification for single-molecule nanopore DNA sequencing.
Nat. Nanotechnol. 4, 265–270 (2009).
The authors demonstrate the use of a mutant alpha-hemolysin for ordered, continuous detection of free nucleotides in solution. This work provides the basis for the approach used by ONT.
61. Voskoboynik, A. et al. The genome sequence of the colonial chordate, Botryllus schlosseri. eLife 2, e00569 (2013).
62. McCoy, R. C. et al. Illumina TruSeq synthetic long- reads empower de novo assembly and resolve complex, highly-repetitive transposable elements. PLoS ONE 9, e106689 (2014).
63. Schatz, M. C., Delcher, A. L. & Salzberg, S. L. Assembly of large genomes using second-generation sequencing. Genome Res. 20, 1165–1173 (2010).
64. English, A. C. et al. Assessing structural variation in a personal genome-towards a human reference diploid genome. BMC Genomics 16, 286 (2015).
65. Carneiro, M. O. et al. Pacific Biosciences sequencing technology for genotyping and variation discovery in human data. BMC Genomics 13, 375 (2012).
66. Quail, M. A. et al. A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers. BMC Genomics 13, 341 (2012).
67. Koren, S. et al. Hybrid error correction and de novo assembly of single-molecule sequencing reads.
Nat. Biotechnol. 30, 693–700 (2012).
68. Larsen, P. A., Heilman, A. M. & Yoder, A. D. The utility of PacBio circular consensus sequencing for characterizing complex gene families in non-model organisms. BMC Genomics 15, 720 (2014).
69. Heger, M. PacBio launches higher-throughput, lower- cost single-molecule sequencing system. GenomeWeb [online], https://www.genomeweb.com/business-news/ pacbio-launches-higher-throughput-lower-cost-single- molecule-sequencing-system (01 Oct 2015).
70. Goodwin, S. et al. Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome. Genome Res. 25, 1750–1756 (2015).
71. Jain, M. et al. Improved data analysis for the MinION nanopore sequencer. Nat. Methods 12, 351–356 (2015).
72. Heger, M. 10X Genomics, Pacific Biosciences
provide business updates at JP Morgan
Healthcare Conference. GenomeWeb [online], https:// www.genomeweb.com/sequencing-technology/ 10x-genomics-pacific-biosciences-provide-business- updates-jp-morgan-healthcare (13 Jan 2016).
73. Cirulli, E. T. & Goldstein, D. B. Uncovering the roles of rare variants in common disease through whole- genome sequencing. Nat. Rev. Genet. 11, 415–425 (2010).
This review provides a comprehensive overview of advances in, and challenges of using, WGS for variant discovery in human disease.
74. Ellis, M. J. et al. Whole-genome analysis informs breast cancer response to aromatase inhibition. Nature 486, 353–360 (2012).
75. Prat, A. & Perou, C. M. Mammary development meets cancer genomics. Nat. Med. 15, 842–844 (2009).
76. 1000 Genomes Project Consortium. A map of human genome variation from population-scale sequencing. Nature 467, 1061–1073 (2010).
77. 1000 Genomes Project Consortium. A global reference for human genetic variation. Nature 526, 68–74 (2015).
78. Sudmant, P. H. et al. An integrated map of structural variation in 2,504 human genomes. Nature 526, 75–81 (2015).
79. UK10K Consortium. The UK10K project identifies rare variants in health and disease. Nature 526, 82–90 (2015).
80. Gudbjartsson, D. F. et al. Large-scale whole-genome sequencing of the Icelandic population. Nat. Genet. 47, 435–444 (2015).
81. Regalado, A. U.S. to develop DNA study of one million people. MIT Technology Review [online], http://www.technologyreview.com/news/534591/ us-to-develop-dna-study-of-one-million-people (30 Jan 2015).
82. Sidore, C. et al. Genome sequencing elucidates Sardinian genetic architecture and augments association analyses for lipid and blood inflammatory markers. Nat. Genet. 47, 1272–1281 (2015).
83. Hodges, E. et al. Genome-wide in situ exon capture for selective resequencing. Nat. Genet. 39, 1522–1527 (2015).
This paper describes the in situ capture and selective enrichment of human exons for downstream NGS. This manuscript provides the methodological basis for whole-exome and targeted sequencing.
84. Iossifov, I. et al. The contribution of de novo coding mutations to autism spectrum disorder. Nature 515, 216–221 (2014).
85. O’Roak, B. J. et al. Sporadic autism exomes reveal a highly interconnected protein network of de novo mutations. Nature 485, 246–250 (2012).
86. Sanders, S. J. et al. De novo mutations revealed by whole-exome sequencing are strongly associated with autism. Nature 485, 237–241 (2012).
87. Griffith, M. et al. Optimizing cancer genome sequencing and analysis. Cell Syst. 1, 210–223 (2015).
88. Rauch, C. et al. Towards an understanding of DNA recognition by the methyl-CpG binding domain 1. J. Biomol. Struct. Dyn. 22, 695–706 (2005).
89. Oda, M. et al. High-resolution genome-wide cytosine methylation profiling with simultaneous copy number analysis and optimization for limited cell numbers. Nucleic Acids Res. 37, 3829–3839 (2009).
90. Irizarry, R. A. et al. Comprehensive high-throughput arrays for relative methylation (CHARM). Genome Res. 18, 780–790 (2008).
91. Meissner, A. et al. Reduced representation bisulfite sequencing for comparative high-resolution DNA methylation analysis. Nucleic Acids Res. 33, 5868–5877 (2005).
92. Flusberg, B. A. et al. Direct detection of DNA methylation during single-molecule, real-time sequencing. Nat. Methods 7, 461–465 (2010).
93. Wescoe, Z. L., Schreiber, J. & Akeson, M. Nanopores discriminate among five C5-cytosine variants in DNA. J. Am. Chem. Soc. 136, 16582–16587 (2014).
94. Lam, E. T. et al. Genome mapping on nanochannel arrays for structural variation analysis and sequence assembly. Nat. Biotechnol. 30, 771–776 (2012).
95. Eichler, E. E., Clark, R. A. & She, X. An assessment of the sequence gaps: unfinished business in a finished human genome. Nat. Rev. Genet. 5, 345–354 (2004).
96. Chaisson, M. J., Wilson, R. K. & Eichler, E. E. Genetic variation and the de novo assembly of human genomes. Nat. Rev. Genet. 16, 627–640 (2015).
97. Chaisson, M. J. et al. Resolving the complexity of the human genome using single-molecule sequencing. Nature 517, 608–611 (2015).
This article provides strong support for the utility of long-read sequencing for generating high-quality reference genomes. The authors demonstrate this by closing and/or extending gaps and resolving structural variants in the GRCh37 human reference genome.
98. Ritz, A. et al. Characterization of structural variants with single molecule and hybrid sequencing approaches. Bioinformatics 30, 3458–3466 (2014).
99. Snyder, M. W., Adey, A., Kitzman, J. O. & Shendure, J. Haplotype-resolved genome sequencing: experimental methods and applications. Nat. Rev. Genet. 16, 344–358 (2015).
100. Kuleshov, V. et al. Whole-genome haplotyping using long reads and statistical methods. Nat. Biotechnol. 32, 261–266 (2014).
101. Treutlein, B. et al. Reconstructing lineage hierarchies of the distal lung epithelium using single-cell RNA-seq. Nature 509, 371–375 (2014).
102. Sharon, D., Tilgner, H., Grubert, F. & Snyder, M. A single-molecule long-read survey of the human transcriptome. Nat. Biotechnol. 31, 1009–1014 (2013).
103. Quick, J. et al. Rapid draft sequencing and real-time nanopore sequencing in a hospital outbreak of Salmonella. Genome Biol. 16, 114 (2015).
104. Quick, J. et al. Real-time, portable genome sequencing for Ebola surveillance. Nature 530, 228–232 (2016).
105. GenomeWeb. White House announces efforts to accelerate precision medicine initiative. GenomeWeb [online], https://www.genomeweb.com/molecular- diagnostics/white-house-announces-efforts-accelerate- precision-medicine-initiative (25 Feb 2016).
106. Illumina. Illumina forms new company to enable early cancer detection via blood-based screening — Press Release. Illumina [online], http://www.illumina.com/ company/news-center/press-releases/press-release- details.html?newsid=2127903 (10 Jan 2016).
107. Schatz, M. C. & Langmead, B. The DNA data deluge: fast, efficient genome sequencing machines are spewing out more data than geneticists can analyze. IEEE Spectr. 50, 26–33 (2013).
108. Pop, M. & Salzberg, S. L. Bioinformatics challenges of new sequencing technology. Trends Genet. 24, 142–149 (2008).
109. Sunyaev, S. R. Inferring causality and functional significance of human coding DNA variants. Hum. Mol. Genet. 21, R10–R17 (2012).
110. Gargis, A. S. et al. Assuring the quality of next- generation sequencing in clinical laboratory practice. Nat. Biotechnol. 30, 1033–1036 (2012).
111. Chrystoja, C. C. & Diamandis, E. P. Whole genome sequencing as a diagnostic test: challenges and opportunities. Clin. Chem. 60, 724–733 (2014).
112. McGuire, A. L. et al. Point-counterpoint. Ethics and genomic incidental findings. Science 340, 1047–1048 (2013).
113. Bowers, J. et al. Virtual terminator nucleotides for next-generation DNA sequencing. Nat. Methods 6, 593–595 (2009).
114. Heger, M. China’s Direct Genomics unveils new targeted NGS system based on Helicos Tech for clinical use. GenomeWeb [online], https://www.genomeweb. com/business-news/chinas-direct-genomics-unveils- new-targeted-ngs-system-based-helicos-tech-clinical- use (27 Oct 2015).
115. Karow, J. Oxford Nanopore presents details on new high-throughput sequencer, improvements to MinIon. GenomeWeb [online], https://www.genomeweb.com/ sequencing/oxford-nanopore-presents-details-new- high-throughput-sequencer-improvements-mini(16 Sep 2014).
116. Karow, J. Sigma-Aldrich enters co-marketing
agreement with GenapSys for Genius sequencer. GenomeWeb [online], https://www.genomeweb.com/ sequencing-technology/sigma-aldrich-enters-co- marketing-agreement-genapsys-genius-sequencer (1 Jul 2015).
117. Roche. Roche acquires Genia Technologies to strengthen next generation sequencing pipeline — Press Release. Roche [online], http://www.roche.com/ media/store/releases/med-cor-2014-06-02.htm(2 Jun 2014).

來(lái)源:上海伯豪生物技術(shù)有限公司
聯(lián)系電話(huà):021-58955370
E-mail:market@shbio.com

用戶(hù)名: 密碼: 匿名 快速注冊(cè) 忘記密碼
評(píng)論只代表網(wǎng)友觀點(diǎn),不代表本站觀點(diǎn)。 請(qǐng)輸入驗(yàn)證碼: 8795
Copyright(C) 1998-2024 生物器材網(wǎng) 電話(huà):021-64166852;13621656896 E-mail:info@bio-equip.com