在農(nóng)業(yè)生產(chǎn)中,性狀相關(guān)的基因定位對于科學(xué)育種十分重要,傳統(tǒng)的遺傳重組定位具有指導(dǎo)意義和實用價值,但傳統(tǒng)方法周期長、耗費大。隨著二代測序的發(fā)展,DNA測序速度大大加快、成本大大降低,使得通過測序法進(jìn)行的基因定位(mapping-by-sequencing)成為越來越多動植物研究的主要手段。對合適的樣本群體,在完整的基因組參考序列的條件下,結(jié)合傳統(tǒng)集群分離分析(BSA)和二代測序方法,可以快速定位性狀相關(guān)基因。在短短幾天內(nèi),可通過數(shù)據(jù)運算界定出基因所在區(qū)域,進(jìn)一步鎖定基因。這一方法已經(jīng)在擬南芥、水稻、玉米、小鼠、斑馬魚等等的基因定位中得到了應(yīng)用。
通常這一應(yīng)用的前提需要一個高質(zhì)量、較完整的參考基因組序列,包括所有基因及其他基因組序列信息。然而,在農(nóng)業(yè)中的許多重要作物,如大麥、小麥等等的基因組圖譜并不完整。最近德國科學(xué)家在Genome Biology上發(fā)表文章1,介紹了通過外顯子組二代測序方法定位一個影響大麥出葉速率(leaf initiation rate)的基因,表明即使在基因組并不完整的情況下也可以進(jìn)行測序法的基因定位。
此次研究針對大麥多節(jié)矮稈突變體(mnd),這一突變體的最顯著特點是葉間期縮短,出葉速度加快,葉子數(shù)量平均為野生型的2倍,節(jié)間莖稈長度縮短,并伴有葉子形狀的改變等等。利用X光誘發(fā)的多節(jié)矮稈突變體與野生型cv. Barke雜交獲得F2代,在100個F2中有19%為突變型、81%為野生型,該性狀為單基因隱性遺傳。取18個突變體的DNA混合成一個突變樣本群的DNA混合物,再隨機選取30個野生型混合成野生型樣本群的DNA混合物,對這兩個DNA混合物分別用NimbleGen大麥外顯子組探針富集大麥基因組的編碼序列后,進(jìn)行二代測序。
圖:基因定位:通過突變樣本群和野生樣本群等位基因頻率的差異定位候選基因。摘自Mascher M, Jost M, Kuon JE, Himmelbach A, Aßfalg A, Beier S, Scholz U, Graner A, Stein N. Mapping-by-sequencing accelerates forward genetics in barley. Genome Biol. 2014. Jun 10;15(6):R78
突變樣本群和野生型樣本群分別獲得8.2 Gb和7Gb測序數(shù)據(jù),比對cv. Barke的全基因組鳥槍法測序拼接結(jié)果后,分析SNP位點及其等位基因頻率。比較2個樣本群的SNP位點等位基因頻率,在染色體5H長臂發(fā)現(xiàn)一個30cM區(qū)域,該區(qū)域內(nèi)突變型的SNP等位基因頻率達(dá)95%,而野生型的SNP頻率僅為30%。同時,由于X光所引發(fā)的突變多為缺失突變,在測序數(shù)據(jù)中通過測序深度尋找>150bp的缺失突變,發(fā)現(xiàn)有18個缺失位于上述區(qū)域。在缺失片段對應(yīng)的contig中,contig 49382位于5H 96 cM,有2個缺失區(qū)域,是一個被注釋為“Cytochrome P450”的MLOC_64838.2基因的2個外顯子。Blastn的結(jié)果顯示這個基因編碼的蛋白與水稻PLASTOCHRON1 (pla1)基因編碼的蛋白序列相似,pla1基因的突變會使得水稻有類似大麥多節(jié)矮稈突變體的表型,作者認(rèn)為MLOC_64838.2基因很可能是控制這個形狀的基因。文章還在其他大麥多節(jié)矮稈突變體中進(jìn)行了這個基因的驗證,并在大麥的物理圖譜中定位了這個基因。作者認(rèn)為,利用大量現(xiàn)有的大麥突變體資源,結(jié)合外顯子組測序、合理數(shù)據(jù)分析方法以及現(xiàn)有的基因組資源,可以經(jīng)濟有效地對大麥進(jìn)行測序法的基因定位(mapping by sequencing),同樣的方法也可以用于其他基因組龐大的物種的類似研究。
此文中所用的NimbleGen大麥外顯子組探針設(shè)計基于現(xiàn)有大麥基因組拼接的注釋,并參考全長RNA序列以及RNASeq測序序列設(shè)計,總共約88.6Mb目標(biāo)序列,對應(yīng)目前大麥基因組中~60Mb左右的編碼區(qū)域。大麥外顯子組捕獲產(chǎn)品在一個捕獲反應(yīng)溶液中有約420萬種不同的DNA探針,體現(xiàn)了NimbleGen高密度探針的生產(chǎn)和設(shè)計能力,可以有效覆蓋和捕獲目標(biāo)區(qū)域。2013年11月在The Plant Journal發(fā)表的一篇文獻(xiàn)2,也運用該大麥外顯子組捕獲產(chǎn)品,對不同品系的種植大麥及野生大麥進(jìn)行了實驗,隨后進(jìn)行SNP發(fā)現(xiàn)、多樣性分析和進(jìn)化分析,文章指出這個工具可以應(yīng)用于多種品系的大麥、甚至小麥,幫助mRNA編碼區(qū)的變異研究,通過混合捕獲和減少測序量大大降低研究成本,從而推進(jìn)大麥遺傳多樣性及基因性狀研究。
1. Mascher M, Jost M, Kuon JE, Himmelbach A, Aßfalg A, Beier S, Scholz U, Graner A, Stein N.Mapping-by-sequencing accelerates forward genetics in barley. Genome Biol. 2014. Jun 10;15(6):R78.
2. Mascher M, Richmond TA, Gerhardt DJ, Himmelbach A, Clissold L, Sampath D, Ayling S, Steuernagel B, Pfeifer M, D'Ascenzo M, Akhunov ED, Hedley PE, Gonzales AM, Morrell PL, Kilian B, Blattner FR, Scholz U, Mayer KF, Flavell AJ, Muehlbauer GJ, Waugh R, Jeddeloh JA, Stein N.Barley whole exome capture: a tool for genomic research in the genus Hordeum and beyond.Plant J. 2013 Nov;76(3):494-505. doi: 10.1111/tpj.12294. Epub 2013 Aug 24.
僅用于科研,不用于臨床診斷