美國(guó)國(guó)家癌癥研究所的研究人員在近日發(fā)表的有關(guān)Proton和HiSeq 平臺(tái)的對(duì)比研究顯示,在進(jìn)行外顯子組測(cè)序時(shí),Life Technologies的Ion Proton和Illumina的HiSeq 2000在單核苷酸變異檢測(cè)方面均表現(xiàn)良好,但在準(zhǔn)確檢測(cè)插入缺失時(shí)存在某些問(wèn)題。
該研究于本月初刊載在《人類遺傳學(xué)》上,很可能是首個(gè)發(fā)表的有關(guān)這兩個(gè)平臺(tái)性能對(duì)比的研究。該研究將采用Proton和HiSeq對(duì)HapMap CEPH三元家族生成的全外顯子組測(cè)序數(shù)據(jù)檢測(cè)到的變異進(jìn)行了比較。此外,還對(duì)從Complete Genomics公司獲得的全基因組測(cè)序數(shù)據(jù)的變異以及相同三元家族的Illumina SNP微陣列數(shù)據(jù)的變異進(jìn)行了對(duì)比。
美國(guó)國(guó)家癌癥研究所(NCI)癌癥基因組學(xué)研究實(shí)驗(yàn)室的研發(fā)部主任和該研究的首席作者Joe Boland聲稱,本項(xiàng)目旨在評(píng)估其實(shí)驗(yàn)室能否將去年九月安裝的Ion Proton常規(guī)用于外顯子組測(cè)序,以作為HiSeq的可行替代方案。Joe Boland表示,“HiSeq是目前研究的黃金標(biāo)準(zhǔn)”。
“令人興奮的是,答案是肯定的,Proton的表現(xiàn)與HiSeqs旗鼓相當(dāng)”,Joe Boland告訴《In Sequence》!拌b于我們?cè)赑GMs方面的經(jīng)驗(yàn),對(duì)于一個(gè)新平臺(tái)而言,我們希望它具有競(jìng)爭(zhēng)力,但又不指望其像數(shù)據(jù)中所顯示的那樣卓越——因?yàn)樗呀?jīng)遠(yuǎn)遠(yuǎn)超出了我們對(duì)它的期盼!
Proton和HiSeq 平臺(tái)在單核苷酸變異檢測(cè)方面表現(xiàn)良好,但在插入缺失上卻存在差異,出現(xiàn)某些問(wèn)題!斑@兩個(gè)平臺(tái)在檢測(cè)插入缺失方面有利有弊。我認(rèn)為,如果您只需在[生成數(shù)據(jù)]后進(jìn)行仔細(xì)的搜集,則這兩個(gè)平臺(tái)足以滿足您的需求”, Boland說(shuō)。
NCI實(shí)驗(yàn)室最近配置了六臺(tái)Ion Torrent PGM,四臺(tái)Ion Proton,一臺(tái)HiSeq 2000,一臺(tái)HiSeq 2500 ,以及一臺(tái)MiSeq。
開展研究后,研究人員于12月和1月生成了相關(guān)數(shù)據(jù),并在2月的基因組生物學(xué)和技術(shù)進(jìn)步會(huì)議(IS 2/26/2013)上提交了初步結(jié)果。目前,該實(shí)驗(yàn)室根據(jù)機(jī)器的可用性以及生成結(jié)果的速度采用HiSeqs和 Protons進(jìn)行全外顯子組測(cè)序。 實(shí)驗(yàn)室的多個(gè)項(xiàng)目涉及家族性外顯子組研究,如果HiSeqs被預(yù)定完,則將轉(zhuǎn)為采用Proton進(jìn)行小型家族性外顯子組研究,Boland表示。 “由于這兩個(gè)平臺(tái)的質(zhì)量目前不相上下,如果我們從一個(gè)平臺(tái)轉(zhuǎn)向采用另一個(gè)平臺(tái),這不會(huì)給我們的研究人員帶來(lái)任何困難”。 實(shí)驗(yàn)實(shí)驗(yàn)室目前主要采用Protons開展轉(zhuǎn)錄組測(cè)序研究,Boland說(shuō)。
實(shí)驗(yàn)室采用任一平臺(tái)進(jìn)行全外顯子組測(cè)序時(shí),各樣本的費(fèi)用差額在$150以內(nèi),Boland表示,“在確定運(yùn)行哪個(gè)平臺(tái)時(shí),價(jià)格不是主要的考慮因素”。
為進(jìn)行對(duì)比,研究人員采用Ion Proton和HiSeq 2000對(duì)CEPH三元家族的外顯子組進(jìn)行了測(cè)序。為捕獲外顯子組數(shù)據(jù),研究人員在采用Proton 時(shí)使用的是Life Tech的TargetSeq Exome v2,可包含50百萬(wàn)堿基序列;而在采用Illumina時(shí)使用的是NimbleGen SeqCap EZ Exome v3,其能捕獲約64百萬(wàn)堿基序列。 研究人員將其分析限制在43百萬(wàn)堿基序列上,即兩個(gè)外顯子組捕獲試劑的重疊部分。
采用Proton進(jìn)行測(cè)序時(shí),各樣本至少生成9千兆堿基數(shù)據(jù),其中80%的讀數(shù)直指目標(biāo)。為檢測(cè)變異,通過(guò)Ion Reporter的標(biāo)準(zhǔn)管道運(yùn)行數(shù)據(jù)。
采用HiSeq進(jìn)行測(cè)序時(shí),各樣本至少生成11千兆堿基數(shù)據(jù),其中66%的讀數(shù)直指目標(biāo)。使用GATK管道檢測(cè)變異。
在共享外顯子組中,采用Proton時(shí),各樣本平均檢測(cè)到了約28,000個(gè)變異,而采用Illumina時(shí)為34,000個(gè)——兩個(gè)平臺(tái)共享了約3/4的變異。
兩個(gè)平臺(tái)在進(jìn)行單核苷酸變異檢測(cè)時(shí)產(chǎn)生的結(jié)果大幅重疊,遠(yuǎn)遠(yuǎn)超過(guò)了插入缺失的重疊部分。以代表樣本為例,兩個(gè)平臺(tái)都檢測(cè)出了約25,700個(gè)單核苷酸變異。 此外,僅Proton 檢測(cè)出了1,100個(gè)單核苷酸變異,而僅HiSeq檢測(cè)出了7,000個(gè)。
以相同樣本為例,這兩個(gè)平臺(tái)共同檢測(cè)出了約600個(gè)插入缺失,但是,Proton和HiSeq還分別檢測(cè)了另外的880個(gè)和920個(gè)插入缺失。研究人員在對(duì)特定平臺(tái)的插入缺失亞群進(jìn)行分析時(shí)發(fā)現(xiàn),“由于比對(duì)問(wèn)題及/或均聚物序列,很多插入缺失呈現(xiàn)出假陽(yáng)性”。
研究人員還將通過(guò)Proton、HiSeq和Complete Genomics 檢測(cè)出的單核苷酸變異和插入缺失進(jìn)行了比較,發(fā)現(xiàn)這三個(gè)平臺(tái)檢測(cè)出了66%的(或23,700個(gè))單核苷酸變異,但是僅檢測(cè)出了18%(總共530個(gè))的插入缺失。
Proton檢測(cè)出了830個(gè)特定于該平臺(tái)的插入缺失;之后是Complete,為540個(gè);最后是Illumina,為440個(gè)?茖W(xué)家們得出結(jié)論,其分析“在檢測(cè)較小的插入缺失時(shí),識(shí)別出了各方法存在的主要差異,這給進(jìn)一步提高技術(shù)測(cè)序及/或生物信息學(xué)算法提出了重大挑戰(zhàn)”。
在 將采用Proton 和HiSeq得出的SNP基因分型與三個(gè)三元樣本中的兩個(gè)的SNP微陣列數(shù)據(jù)進(jìn)行比較時(shí),科學(xué)家們發(fā)現(xiàn),經(jīng)采用這兩個(gè)平臺(tái),各樣本表現(xiàn)出很高的一致性,高達(dá)99%,表明SNP檢測(cè)具有較高質(zhì)量。
研究人員還通過(guò)檢測(cè)和分析讀數(shù)比對(duì),更加密切地關(guān)注特定平臺(tái)變異的檢測(cè)情況。
很多Illumina平臺(tái)的特定單核苷酸變異為片段重復(fù)或簡(jiǎn)單重復(fù)。 研究人員指出,根據(jù)Proton的數(shù)據(jù),可以發(fā)現(xiàn)單拷貝區(qū)的單核苷酸變異具有較低的覆蓋率,因此Proton很可能遺漏了該等單核苷酸變異;但是Illumina的數(shù)據(jù)中也可能遺漏了SNP檢測(cè),該等檢測(cè)在Proton的數(shù)據(jù)中“明顯且清晰”。
Boland說(shuō),其采用兩種不同的捕獲試劑的原因在于,在Proton平臺(tái)使用NimbleGen(羅氏)或Agilent(安捷倫)SureSelect捕獲試劑時(shí)尚無(wú)任何“商業(yè)許可”協(xié)議!拔覀兊南敕ㄊ,采用任何批準(zhǔn)的東西,以便于人們從貨架上選擇產(chǎn)品并進(jìn)行使用”,Boland說(shuō)。由于僅對(duì)重疊區(qū)域進(jìn)行了分析并僅使用了相同的DNA樣本,“在我們看來(lái),這樣做是絕對(duì)有效的”。
在論文中,研究人員指出,較之HiSeq ,Proton的運(yùn)行時(shí)間 “明顯縮短”, 僅為11.5小時(shí)(包括數(shù)據(jù)處理的時(shí)間),而前者通常需要六天的運(yùn)行時(shí)間。
自從開展該項(xiàng)研究后,也對(duì)Proton進(jìn)行了改進(jìn)。據(jù)Mike Lelivelt—Ion Torrent的生物信息學(xué)和軟件產(chǎn)品主管說(shuō),由于提高了各芯片的輸出性能,目前,客戶可以采用各PI芯片同時(shí)對(duì)兩個(gè)(而非一個(gè))外顯子組進(jìn)行測(cè)序。
Mike Lelivelt在研究中聲稱,公司“對(duì)Proton系統(tǒng)用于外顯子組測(cè)序的表現(xiàn)感到十分滿意”,這表明“盡管對(duì)于各平臺(tái)而言,進(jìn)行準(zhǔn)確的插入缺失檢測(cè)仍然任重道遠(yuǎn)”,但是,“該等平臺(tái)在單核苷酸變異檢測(cè)方面已經(jīng)遙遙領(lǐng)先”。Mike Lelivelt還指出,在所有變異中,插入缺失檢測(cè)的比例要遠(yuǎn)低于單核苷酸變異檢測(cè)。
Boland說(shuō),其小組目前正在開展其他的平臺(tái)比較,此類平臺(tái)關(guān)注于全轉(zhuǎn)錄組測(cè)序和擴(kuò)增子測(cè)序。該小組還對(duì)特定平臺(tái)的單核苷酸變異和插入缺失做了進(jìn)一步分析,以探明其他平臺(tái)遺漏該等單核苷酸變異和插入缺失的原因。 Boland計(jì)劃于秋季提交其研究的最初結(jié)果。