作為一個致力于研究人類基因組測序參考材料的團體,瓶中基因聯(lián)盟(Genome in a Bottle Consortium)計劃于明年初發(fā)布其首個試點參考材料、高度表征的HapMap樣本以及一組高度可信的基因組檢測。
該團體最近發(fā)布了一組基于公開提供的測序數(shù)據(jù)之分析進行的高度可信的基因組檢測,并著手對測序進行更加詳細的描述。
在美國國家標(biāo)準和技術(shù)研究院(NIST)的倡導(dǎo)下,該聯(lián)盟去年首次召開了研討會,并于下個月再次舉行研討會,旨在制訂基因組指標(biāo)(CSN 9/5/2012),從而滿足實驗室呼吁建立可信賴標(biāo)準以核查其測序運行性能的需求。
“目前,對于變異檢測的可信度而言,尚無廣泛接受的基因組標(biāo)準或量化性能指標(biāo)”,該聯(lián)盟在最近的會議摘要中提到,“而在聲研究、重現(xiàn)研究以及臨床監(jiān)管應(yīng)用的測量結(jié)果中實現(xiàn)可信度需要這樣的標(biāo)準或指標(biāo)”。
該項目由4個工作小組組成: 第一小組負責(zé)選擇和設(shè)計參考材料;第二小組側(cè)重于生物信息學(xué)、數(shù)據(jù)整合和數(shù)據(jù)表達;第三小組負責(zé)處理測量以描述參考材料;第四小組關(guān)注性能指標(biāo)。
自去年克服最初有關(guān)HapMap樣本需獲得知情同意的顧慮后,該聯(lián)盟決定采用NA12878樣本(該樣本來自具有猶他州CEPH血統(tǒng)的一位婦女)作為其試點參考材料。 該樣本已廣泛用于多個發(fā)表的測序研究中!拔覀兞私饽壳八鶑氖碌墓ぷ,這將成為非常棒的試點基因組”,該聯(lián)盟的組織者以及NIST的團隊負責(zé)人Marc Salit說。
NIST已經(jīng)批準發(fā)布參考材料,并表示“我們將繼續(xù)監(jiān)測已知領(lǐng)域的任何新開發(fā)”,該聯(lián)盟的另一名領(lǐng)導(dǎo)人兼NIST的生物醫(yī)學(xué)工程師Justin Zook表示。
卡瑞爾細胞庫最近為該聯(lián)盟培養(yǎng)了大量NA12878細胞,并提取了DNA,共計8,300小瓶,每瓶10微克,實驗室明年將申請索要該等樣本。 Salit表示,“據(jù)我們所知,已經(jīng)制備好了最大批的基因組DNA,以便進行基因組研究”這是為基因組研究制備的最大批的基因組DNA了。
由于細胞培養(yǎng)中可能會發(fā)生突變,NIST的科學(xué)家將采用深度測序和淺度測序相結(jié)合的方法對多瓶DNA進行描述,以探求材料的同質(zhì)性。
此外,NIST計劃將DNA送至聯(lián)盟成員處,這些成員對協(xié)助科學(xué)家更加詳細地描述參考材料倍感興趣。 截至目前,已有九個小組表示其愿意參與,之后將有更多小組加入其中。 “我們的想法是通過多個平臺在多個實驗室進行描述”,Zook說。
NIST的研究人員計劃采用Life Technologies的SOLiD 和Ion Torrent以及 Illumina的測序平臺,以對NA12878進行研究。此外,研究人員希望通過Complete Genomics獲得測序數(shù)據(jù),包括根據(jù)其長片段讀取技術(shù)獲得的數(shù)據(jù)以及從測序平臺的出售商處獲得的數(shù)據(jù)!案髦饕脚_的出售商均表示,產(chǎn)生參考材料時,其將對參考材料進行描述”, Salit說。
太平洋生物科學(xué)公司在與威爾康乃爾醫(yī)學(xué)院和其他地方的學(xué)術(shù)小組的協(xié)力合作下,一直在對NA12878進行測序,其計劃為瓶中基因聯(lián)盟提供幫助,但是他們采用的是不同批的DNA,Zook指出。 “我們不指望不同批的DNA之間會出現(xiàn)較大差異,但是,我們需要確認可能存在哪些差異”, Zook說。 該小組已經(jīng)產(chǎn)生約20倍至30倍的覆蓋度,其計劃提高到50倍至60倍,Zook補充說。
瓶中基因聯(lián)盟計劃于明年初發(fā)布NA12878 DNA以作為NIST的官方參考材料,此外,還會發(fā)布一組高度可信的單核苷酸多態(tài)性(SNP)和插入缺失。 該聯(lián)盟將隨著時間對變異情況進行更新,并擴展至結(jié)構(gòu)變異和基因組的復(fù)雜區(qū)域。
同時,NIST的科學(xué)家已開發(fā)出從樣本可用的多個數(shù)據(jù)集中識別高度可信的基因型檢測(包括純合子參考檢測)的方法,其目前正著手在某期刊上發(fā)表該方法。
截至目前,科學(xué)家們已從用于NA12878的共計12個數(shù)據(jù)集中識別出一組高度可信的SNP和插入缺失,并將相關(guān)變異文檔發(fā)布到上月與國家生物技術(shù)信息中心共同建立的新的FTP網(wǎng)站上。
Zook 解釋說,F(xiàn)TP網(wǎng)站“目前仍在積極開發(fā)中“。該網(wǎng)站同樣包括由Illumina、SOLiD、Complete Genomics、Ion Torrent、454、PacBio和Sanger測序平臺生成的數(shù)據(jù)集。
最終,該網(wǎng)站將匯集大量瓶中基因聯(lián)盟計劃開發(fā)的、適用于所有參考基因組的原始數(shù)據(jù)文件、序列文件和變異檢測文件。
NIST已將其一組可信變異分送至至少12個小組,包括學(xué)術(shù)和政府實驗室以及協(xié)助改善檢測的臨床實驗室。
“由于許多人已經(jīng)常對NA12878進行測序,他們發(fā)現(xiàn)此類檢測對探詢其所用方法的正確度是非常有用的,尤其是有利于人們進一步了解變異檢測中哪些內(nèi)容可信、哪些不可信”,Zook說。
該聯(lián)盟正與基因組比較和分析測試委員會(GCAT)開展合作(BI 4/19/2013),以匯集其高度可信的基因型檢測,使得用戶可以將不同生物信息學(xué)方法進行比較,以了解此類方法對變異檢測的具體效果。 “我們認為,對于我們社會而言,這將成為真正有價值的資源”, Zook說。
此外,該聯(lián)盟正與美國疾病控制與預(yù)防中心的基因檢測參考材料協(xié)調(diào)項目(GeT-RM)開展密切協(xié)作,以匯集GeT-RM最近發(fā)布的數(shù)據(jù)。“可能會產(chǎn)生大量重復(fù)”, Zook表示,并指出上述兩個項目均會使用對方的數(shù)據(jù)。
除了將NA12878開發(fā)成為其試點參考材料外,瓶中基因聯(lián)盟還在調(diào)查比HapMap樣本使用更廣、最近知情批準的其他樣本,以將該等樣本作為參考材料。
特別是,該聯(lián)盟最近獲得已參與哈佛醫(yī)學(xué)院的個人基因組項目的中國裔父子三元樣本,其剛剛向卡瑞爾提交了大批量增加此類樣本的細胞的請求,并希望在今年底可以向其提供!拔覀兊挠媱澥窃谖磥硪粌赡陜(nèi)擁有一組約8個家庭的樣本,至少為具有PGP或不同血統(tǒng)的母-父-子三元樣本”,Zook補充說。
與人類基因組類似,該聯(lián)盟正在開發(fā)可在測序試驗中作為激增控制使用的合成DNA序列,以確定突變的檢測限度,由于體細胞突變的出現(xiàn)頻率較低,這對癌癥測序尤其重要。
到目前為止,該聯(lián)盟已開發(fā)出大小約為1千堿基的合成DNA標(biāo)準序列,但是,仍有可能開發(fā)出大小高達10千堿基的合成DNA序列。 盡管如此,目前尚未確定NIST或其他提供商(如公司)可以分配此類激增標(biāo)準。 據(jù)Salit稱,多家公司(包括Life Technologies和 Horizon Diagnostics)已明確表示其有興趣及可能性開發(fā)合成參考材料的商用試劑。 “并不是瓶中基因聯(lián)盟開發(fā)的每個參考材料都需要成為NIST的參考材料”, Salit解釋說。
此外,該聯(lián)盟已就將腫瘤/正常細胞株對開發(fā)成為參考材料進行了商討,目前正就此探索各種方案,包括已供使用的腫瘤/正常細胞株的實驗室間研究。
在即將于8月15日和16日在NIST召開的研討會上,瓶中基因聯(lián)盟計劃就繼續(xù)開展哪些項目做出進一步?jīng)Q定。 “瓶中基因聯(lián)盟雖然是由NIST領(lǐng)導(dǎo)和組建的,但毫無疑問,該聯(lián)盟將會走自己的路”,Salit說!拔蚁M敬窝杏憰茉O(shè)定某些決策制定流程。 作為瓶中基因聯(lián)盟,我們需要進一步向前發(fā)展,因此,我們必須做出明智的選擇”。
Salit 表示,“本著沒有付出就沒有回報的精神”,任何人均可參加本次研討會和加入瓶中基因聯(lián)盟。