高通量測序技術是對傳統(tǒng)測序一次革命性的改變,一次對幾十萬到幾百萬條DNA分子進行序列測定,因此在有些文獻中稱其為下一代測序技術(next generation sequencing)足見其劃時代的改變,同時高通量測序使得對一個物種的轉錄組和基因組進行細致全貌的分析成為可能,所以又被稱為深度測序(deep sequencing)。
自從2005年454 Life Sciences公司(2007年該公司被Roche正式收購)推出了454 FLX焦磷酸測序平臺(454 FLX pyrosequencing platform)以來,曾推出過3730xl DNA測序儀(3730xl DNA Analyzer)的Applied BioSystem(ABI)這家一直占據著測序市場最大份額的公司的領先地位就開始動搖了,因為他們的拳頭產品毛細管陣列電泳測序儀系列(series capillary array electrophoresis sequencing machines)遇到了兩個強有力的競爭對手,一個就是羅氏公司(Roche)的454 測序儀(Roche GS FLX sequencer),,另一個就是2006年美國Illumina公司推出的Solexa基因組分析平臺(Genome Analyzer platform),為此,2007年ABI公司推出了自主研發(fā)的SOLiD 測序儀(ABI SOLiD sequencer)。這三個測序平臺即為目前高通量測序平臺的代表。(見表一)
表一:主流測序平臺一覽
這些平臺共同的特點是極高的測序通量,相對于傳統(tǒng)測序的96道毛細管測序,高通量測序一次實驗可以讀取40萬到400萬條序列。讀取長度根據平臺不同從25bp到450bp,不同的測序平臺在一次實驗中,可以讀取
然而大多數人卻忽略了一個事實,即桑格技術的普及最初也遇到同樣的阻礙。桑格技術剛開發(fā)出來時,閱讀能力很難超過25bp,即使在Fred Sanger雙脫氧終止法發(fā)明后也只達到80bp,如今卻達到了750bp;而新發(fā)展的合成測序技術,應用焦磷酸測序方法,其閱讀能力最初只有100bp,推向市場16個月后增加至250bp,隨著技術的不斷完善,目前已達到了400bp,很快就接近桑格技術目前的水平。除了閱讀能力外,能否以有限的成本用一臺儀器產生足夠數量的序列標記也是另一個需要改善的重要問題。這個問題已經被Roche公司解決了,應用他們的系統(tǒng),僅花費閱讀35bp或者更小片段的成本就能產生比35bp多10倍的序列標記。
圖二:GS FLX 高通量測序方法原理示意圖
一、高通量測序的應用
高通量測序可以幫助研究者跨過文庫構建這一實驗步驟,避免了亞克隆過程中引入的偏差。 依靠后期強大的生物信息學分析能力,對照一個參比基因組(reference genome)高通量測序技術可以非常輕松完成基因組重測序(re-sequence),2007年van Orsouw等人結合改進的AFLP 技術和454 測序技術對玉米基因組進行了重測序,該重測序實驗發(fā)現(xiàn)的超過75%的SNP位點能夠用SNPWave技術驗證,提供了一條對復雜基因組特別是含有高度重復序列的植物基因組進行多態(tài)性分析的技術路線。2008年Hillier對線蟲CB4858 品系進行Solexa重測序,尋找線蟲基因組中的SNP位點和單位點的缺失或擴增。但是也應該看到,由于高通量測序讀取長度的限制,使其在對未知基因組進行從頭測序(novo sequencing)的應用受到限制,這部分工作仍然需要傳統(tǒng)測序(讀取長度達到850 堿基)的協(xié)助。但是這并不影響高通量測序技術在全基因組mRNA表達譜,microRNA表達譜,ChIP-chip以及DNA甲基化等方面的應用。
2008年Mortazavi等人對小鼠的大腦、肝臟和骨骼肌進行了RNA 深度測序,這項工作展示了深度測序在轉錄組研究上的兩大進展,表達計數和序列分析。對測得的每條序列進行計數獲得每個特定轉錄本的表達量,是一種數碼化的表達譜檢測,能檢測到豐度非常低的轉錄本。分析測得的序列,有大于90%的數據顯示落在已知的外顯子中,而那些在已知序列之外的信息通過數據分析展示的是從未被報道過的RNA剪切形式,
高通量測序另一個被廣泛應用的領域是小分子RNA或非編碼RNA(ncRNA)研究。測序方法能輕易的解決芯片技術在檢測小分子時遇到的技術難題(短序列,高度同源), 而且小分子RNA的短序列正好配合了高通量測序的長度,使得數據“不浪費”,同時測序方法還能在實驗中發(fā)現(xiàn)新的小分子RNA。在衣藻、斑馬魚、果蠅、線蟲、人和黑猩猩中都已經成功地找到了新的小分子RNA。在線蟲中獲得了40 萬個序列,通過分析發(fā)現(xiàn)了18個新的小RNA分子和一類全新的小分子RNA。
在DNA—蛋白質相互作用的研究上,染色質免疫沉淀—深度測序(ChIP-seq)實驗也展示了其非常大的潛力。染色質免疫沉淀以后的DNA 直接進行測序,對比ref seq可以直接獲得蛋白與DNA結合的位點信息,相比ChIP-chip,ChIP-seq可以檢測更小的結合區(qū)段、未知的結合位點、結合位點內的突變情況和蛋白親合力較低的區(qū)段。
目前,大多分析家都無法相信新一代測序技術能完全取代目前的芯片測序技術。不過,有些分析家也的確認為芯片測序技術正面臨著挑戰(zhàn),他們認為到了2012年新一代的測序技術將會帶來高達2。15億美元的產值。
2006年,整個芯片測序市場大概價值8億美元,其中65%的市場份額都是有關基因表達譜分析產品的,剩下35%的市場份額則由基因型分析芯片占據。不過美國哈佛大學(Harvard University)遺傳學教授George Church認為,這部分市場也會受到新一代測序技術的沖擊。重測序芯片(resequencing arrays)、單核苷酸多態(tài)性分析芯片以及基因拷貝數目變異分析芯(copy number variant array)市場也會受到影響。也有分析家不贊同這個觀點,他們認為即使新一代測序技術很便宜,還是有不少人會選擇傳統(tǒng)的測序儀的。
新一代測序技術相對傳統(tǒng)芯片測序技術的優(yōu)勢,最終還得依靠廣告和市場營銷手段的推廣才能獲得大眾的認可。去年夏天,由Frost & Sullivan公司對學術科研機構和私人研究團體進行的一項調查研究結果表明,在實際應用領域,例如進行表達譜分析時,人們還是傾向于選擇傳統(tǒng)的芯片產品,而并非青睞新一代的測序產品。
新一代測序儀推廣困難可能由其價格昂貴導致。平均采購一臺新一代測序儀大約要花費50萬美元,除非該實驗室測序的工作量非常大,否則是不會考慮購買的。即使像Polonator這樣的新一代測序儀也需要花費15萬美元左右,這筆費用對于一個小實驗室來說是無法承受的。這時,只需要150美元一塊的芯片就非常有競爭力了。以基因芯片產品享譽業(yè)界的美國Affymetrix公司市場部副總裁Jay Kaufman認為,新一代測序技術對于芯片市場來說的確會帶來一定的沖擊,不過要完全取代表達譜分析芯片還需要一定的時間。
但是,基因芯片也有其自身的缺點,就在于它是一個“封閉系統(tǒng)”,它只能檢測人們已知序列的特征(或有限的變異)。而高通量測序的強項, 就在于它是一個“開放系統(tǒng)”, 它的發(fā)現(xiàn)能力和尋找新的信息的能力,從本質上高于芯片技術。 研究者可以充分享受這兩個平臺的比較優(yōu)勢,在獲取新信息的基礎上,利用芯片的強項, 即對已知信息的高通量、低成本(相對)的檢測能力, 對大量樣品進行快速檢測,短時間內獲得有大量有效的數據。
作為兩個高通量的基因組學研究技術,在應用的某些方面存在重疊和競爭,但是在更多方面是優(yōu)勢互補,兩種方法聯(lián)合使用,將解決以前的單種技術難以解決的問題。
三、結語
新一代測序已顯示出巨大的潛力。也正是因為科學的不斷進步,在給測序技術提出新要求的時候,也給這項技術帶來了新的增長點:
2008年4月Helico BioScience公司的Timothy等人在Science上報道了他們開發(fā)的真正的單分子測序技術,也被稱為第三代測序技術,并利用該技術對一個M13病毒基因組進行重測序。這項技術之所以被稱為真正的單分子測序,是因為它完全跨過了上述3種高通量測序依賴的基于PCR擴增的信號放大過程,真正達到了讀取單個熒光分子的能力,向1000美元測定一個人類基因組的目標邁出了一大步。