強(qiáng)強(qiáng)聯(lián)合:在CRISPR/Cas9相關(guān)研究中應(yīng)用新一代測(cè)序技術(shù)
摘要:
CRISPR/Cas9基因組編輯技術(shù)和新一代測(cè)序技術(shù)(也稱高通量測(cè)序技術(shù)),是當(dāng)今對(duì)生命科學(xué)研究有重大影響的兩項(xiàng)技術(shù)。二者并非毫不相干。有效地將二者聯(lián)用,有時(shí)可以大大加速科研進(jìn)程。兩者之間有什么樣的聯(lián)系呢?在哪些研究領(lǐng)域或方向上可以聯(lián)用呢?上海伯豪生物根據(jù)在這兩個(gè)領(lǐng)域的技術(shù)服務(wù)經(jīng)驗(yàn),對(duì)相關(guān)內(nèi)容進(jìn)行了系統(tǒng)地整理。
一.引言
在分子生物學(xué)的發(fā)展歷史中,人們?cè)?jīng)不止一次地從微生物的某些生命活動(dòng)中得到啟示,發(fā)展出了對(duì)于DNA操作有重要意義的工具,如分子克隆用的限制性內(nèi)切酶和PCR用的耐熱聚合酶。它們?yōu)榉肿由飳W(xué)的發(fā)展帶來了革命性的影響。近兩三年來,另一種從細(xì)菌的獲得性免疫系統(tǒng)發(fā)展而來的革命性的基因操作工具CRISPR/Cas9受到廣泛關(guān)注,其應(yīng)用和影響范圍仍在不斷擴(kuò)大。CRISPR/Cas9系統(tǒng)的發(fā)現(xiàn)與DNA測(cè)序技術(shù)分不開,它的發(fā)展與推廣仍然得益于DNA測(cè)序技術(shù)。CRISPR/Cas9技術(shù)與近五、六年來同樣快速發(fā)展的DNA新一代測(cè)序技術(shù)(Next Generation Sequencing, NGS, 也稱高通量測(cè)序技術(shù))相結(jié)合,不但可以使研究者高效快速地得到一些實(shí)驗(yàn)結(jié)果,也拓寬了這一技術(shù)的應(yīng)用范圍。
二.CRISPR/Cas9系統(tǒng)簡介
CRISPR/Cas9技術(shù)的產(chǎn)生與DNA測(cè)序技術(shù)的進(jìn)步密不可分。1987年在對(duì)大腸桿菌E.coli K12的一個(gè)區(qū)段的測(cè)序結(jié)果的分析中,研究者首次發(fā)現(xiàn)細(xì)菌了堿性磷酸酶基因附近存在著成簇的規(guī)律間隔的短回文重復(fù)序列(Clustered Regularly Interspaced Short Palindromic Repeat, CRISPR)。在接下來的十多年間,隨著DNA測(cè)序技術(shù)的飛速發(fā)展,微生物基因組測(cè)序數(shù)據(jù)顯著增多,更多的CRISPR在細(xì)菌和古細(xì)菌中被發(fā)現(xiàn)。據(jù)估計(jì)40%的細(xì)菌和90%的古細(xì)菌基因組具有CRISPR結(jié)構(gòu)。CRISPR 由一系列短的高度保守的正向重復(fù)序列(repeats) 與長度相似的間隔序列(spacers)間隔排列組成(見圖1)。本世紀(jì)初,CRISPR位點(diǎn)附近的、高度保守的Cas基因(CRISPR-associated genes)引起了研究者關(guān)注。Cas基因是一類基因家族,編碼的蛋白具有與核酸結(jié)合功和核酸酶、聚合酶、解旋酶等活性。2005年,得益于病毒、質(zhì)粒測(cè)序數(shù)據(jù)的日益豐富,通過對(duì)測(cè)序數(shù)據(jù)的系統(tǒng)分析,研究者推測(cè)間隔序列可能與外來的病毒、質(zhì)粒有關(guān)。通過一系列的研究,人們認(rèn)識(shí)到Cas基因可以與CRISPR序列協(xié)同作用,使細(xì)菌對(duì)病毒具有獲得性免疫功能,而間隔序列則編碼引導(dǎo)Cas蛋白定位的向?qū)NA的部分區(qū)段。
圖1. 基因組CRISPR位點(diǎn)。摘自Doudna JA, Charpentier E. Genome editing. The new frontier of genome engineering with CRISPR-Cas9. Science. 2014 Nov 28;346 (6213) :1258096.
根據(jù)Cas基因的不同,人們將CRISPR/Cas系統(tǒng)分為I-III三類。其中II類CRISPR/Cas系統(tǒng)包含一個(gè)Cas9蛋白。這類系統(tǒng)最先在改造后用于小鼠和人類基因組編輯,同時(shí)也是目前研究最為充分的系統(tǒng)。它只需要單獨(dú)的Cas9蛋白即可在gRNA(guide RNA)的引導(dǎo)下完成對(duì)DNA的定點(diǎn)切割。Cas9蛋白可以通過突變改造為具有不同功能的衍生蛋白,例如只具有DNA結(jié)合功能而無切割功能的dCas9和只具有單鏈切割功能的Cas9n(也稱nCas9) 等。Cas9蛋白行使功能需CRISPR轉(zhuǎn)錄而來的crRNA與反式激活的、與CRISPR 重復(fù)區(qū)互補(bǔ)的tracrRNA (trans-activating crRNA,tracrRNA) 形成的復(fù)合物參與。為了操作簡便,研究者將crRNA和tracrRNA 融合進(jìn)同一條單鏈中,設(shè)計(jì)出單鏈引導(dǎo)RNA(single guide RNA,sgRNA)。對(duì)靶序列有效的切割還需靶序列相鄰的原型間隔序列毗鄰基序,即PAM (protospacer-associated motif)。圖2顯示了CRISPR/Cas9 系統(tǒng)的主要元件。為了增強(qiáng)系統(tǒng)的特異性或?qū)崿F(xiàn)某些特定的功能,除了前面提到的對(duì)Cas9蛋白的改造外,一些實(shí)驗(yàn)室還對(duì)有的元件進(jìn)行了其它方面的改進(jìn)。
圖2. RNA 引導(dǎo)Cas9與目標(biāo)DNA結(jié)合并將其切割。摘自Doudna JA, Charpentier E. Genome editing. The new frontier of genome engineering with CRISPR-Cas9. Science. 2014 Nov 28;346(6213) :1258096.
三.CRISPR/Cas9技術(shù)的應(yīng)用領(lǐng)域
對(duì)生物體包括人類自身的基因組進(jìn)行高效自由地操作是許多生命科學(xué)和醫(yī)學(xué)工作者的夢(mèng)想。與傳統(tǒng)的基因打靶、ZFN和TALEN等基因組操作技術(shù)相比,CRISPR/Cas9技術(shù)簡單、高效,也不失精準(zhǔn)。它已經(jīng)成為基因組工程的有力工具。它在生命科學(xué)基礎(chǔ)研究、生物技術(shù)和醫(yī)藥領(lǐng)域有廣泛的應(yīng)用前景。短短一兩年,該技術(shù)成功應(yīng)用于動(dòng)植物及微生物的報(bào)道已屢見不鮮。在生物學(xué)基礎(chǔ)研究領(lǐng)域,它有助于快速解析基因功能及基因間的相互作用;在生物技術(shù)領(lǐng)域,它有助于定向育種,有助于抗逆、高產(chǎn)或有特殊經(jīng)濟(jì)性狀的作物或菌種的培育;在醫(yī)藥領(lǐng)域,利用它可以快速建立疾病模型,可以進(jìn)行基因治療和新藥開發(fā)。CRISPR/Cas9的推廣和應(yīng)用步伐可謂一日千里。
四.CRISPR/Cas9技術(shù)與新一代測(cè)序技術(shù)的聯(lián)用
革命性技術(shù)總是發(fā)展迅速、應(yīng)用廣泛的。作為另一項(xiàng)革命性的生命科學(xué)研究技術(shù),DNA新一代測(cè)序技術(shù)在近五、六年得到快速發(fā)展和推廣。它已經(jīng)用于生命科學(xué)相關(guān)領(lǐng)域的許多方面。同樣地,也可以用在CRISPR/Cas9相關(guān)的研究中。兩者之間的應(yīng)用領(lǐng)域有許多交叉或重合。
1.高通量測(cè)序可用于檢驗(yàn)CRISPR/Cas9基因組編輯的結(jié)果,以及進(jìn)行脫靶效應(yīng)的分析
編碼Cas9和sgRNA的片段通過質(zhì);蚱渌緩睫D(zhuǎn)染進(jìn)細(xì)胞后,Cas9在特異的位點(diǎn)對(duì)目標(biāo)基因組進(jìn)行切割,引起DNA雙鏈斷裂 (double-strand break, DSB),通過非同源末端連接(nonhomologous end joining, NHEJ)或同源重組(homologous recombination, HR),產(chǎn)生DNA的插入或刪除(indel),或者依賴于含有特異突變的同源模板,進(jìn)行目的位點(diǎn)的定向改造;蚪M編輯的結(jié)果需要確認(rèn)。對(duì)于目標(biāo)位點(diǎn)或計(jì)算機(jī)預(yù)測(cè)的脫靶位點(diǎn),除了用核酸酶進(jìn)行電泳分析檢測(cè)外,還可以用DNA測(cè)序方法確認(rèn)是否有變。當(dāng)需要檢測(cè)的樣品較少或靶位點(diǎn)較少時(shí),可以采用Sanger測(cè)序。當(dāng)樣品或靶位點(diǎn)較多時(shí),適合采用高通量測(cè)序。這需要用測(cè)序引物對(duì)靶位點(diǎn)進(jìn)行PCR擴(kuò)增,然后對(duì)擴(kuò)增子(amplicon)測(cè)序。幾種當(dāng)前常用的高通量測(cè)序平臺(tái)均被不同的實(shí)驗(yàn)室采用過。因?yàn)椴煌母咄繙y(cè)序平臺(tái)測(cè)序的最大讀長不一樣,需要注意擴(kuò)增產(chǎn)物的長度和測(cè)序引物的位置。曾有報(bào)道,讀長較長的SMRT DNA 測(cè)序?qū)τ诨蚪M編輯的結(jié)果評(píng)估也很有意義。
CRISPR/Cas9的特異性是人們對(duì)該系統(tǒng)關(guān)心的一個(gè)問題。 它被關(guān)注后不久有報(bào)道提出了CRISPR/Cas9的脫靶問題。脫靶效應(yīng)與諸多因素有關(guān),如sgRNA自身的特征、濃度及其與Cas9的相對(duì)量多少等等。人們通過改造這個(gè)系統(tǒng)的元件或采用不同的策略增加基因組編輯的特異性。盡管一些文獻(xiàn)報(bào)道,對(duì)人類iPSC進(jìn)行CRISPR/Cas9編輯具有很高的特異性,人多能干細(xì)胞中的脫靶突變發(fā)生率很低,但基因組編輯的安全性仍然是人們擔(dān)心的一個(gè)問題,尤其在基因治療領(lǐng)域。全基因組測(cè)序(whole genome sequencing )可以對(duì)整個(gè)基因組進(jìn)行單堿基分辨率的檢測(cè),當(dāng)CRISPR/Cas9用于基因治療等對(duì)安全性要求較高的領(lǐng)域時(shí),有必要采用這一方法檢測(cè)基因組編輯的效果。當(dāng)前已有不少對(duì)CRISPR/Cas9編輯后的基因組進(jìn)行全測(cè)序的實(shí)例。
對(duì)于基因組比較大的生物體來說,全基因組測(cè)序花費(fèi)畢竟是高昂的。那么,此時(shí)如何了解CRISPR/Cas9 在某種生物或某類型的細(xì)胞上是否容易脫靶呢?對(duì)于目標(biāo)區(qū)域進(jìn)行富集,然后對(duì)富集的片段進(jìn)行高通量測(cè)序,是一種策略。對(duì)于DSB區(qū)域的富集與檢測(cè),曾報(bào)道過BLESS 法(Breaks Labeling, Enrichment on Streptavidin, and next generation Sequencing )。最近,J. Keith Joung 領(lǐng)導(dǎo)的小組報(bào)道了一種檢測(cè)方法,稱為Guide-seq (Genome-wide, Unbiased Identification of DSBs Enabled by sequencing)。這種方法的過程是,使活體細(xì)胞吸收雙鏈寡核苷酸(double-stranded oligodeoxynucleotides,dsODN)標(biāo)簽并整合進(jìn)基因組斷裂位點(diǎn),抽提基因組DNA,進(jìn)行隨機(jī)打斷和末端修復(fù)加高通量測(cè)序接頭等操作,然后依據(jù)dsODN的專有序列進(jìn)行PCR擴(kuò)增,富集出包含dsODN的片段,對(duì)收獲的片段進(jìn)行高通量測(cè)序,分析Cas9的切割位點(diǎn)(過程示意見圖3)。它適合臨床前對(duì)所采用的CRISPR/Cas9在某類細(xì)胞中的應(yīng)用風(fēng)險(xiǎn)進(jìn)行評(píng)估。
圖3. Guide-seq 的流程。摘自Tsai SQ等, GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat Biotechnol. 2014 Dec 16.
在進(jìn)行CRISPR/Cas9脫靶效應(yīng)分析時(shí),有些研究者采用了染色質(zhì)免疫共沉淀結(jié)合高通量測(cè)序的方法(chromatin immunoprecipitation and high throughput genome sequencing, ChIP-seq),通過特異性的抗體捕獲Cas9或其衍生物結(jié)合的DNA片段。這也是一種富集測(cè)序策略。
2. CRISPR/Cas9技術(shù)與高通量測(cè)序結(jié)合用于研究基因的功能
Cas9包含兩個(gè)活性區(qū)域,即RuvC 和 HNH 結(jié)構(gòu)域,各負(fù)責(zé)切割一條DNA單鏈。當(dāng)只有一個(gè)結(jié)構(gòu)域引入突變時(shí),Cas9可被改造成為切口酶(nickase)nCas9。nCas9與兩條不同的sgRNA聯(lián)用可用于較大片段的置換,也可增強(qiáng)編輯的特異性;當(dāng)兩個(gè)結(jié)構(gòu)域同時(shí)引入突變時(shí),Cas9內(nèi)切活性喪失,成為dCas9(dead Cas9), dCas9仍能與靶區(qū)域結(jié)合。dCas9 可以用來開啟或關(guān)閉某些基因的表達(dá)。它與目的基因啟動(dòng)子區(qū)域或編碼區(qū)段時(shí),可能由于空間位阻效應(yīng)阻擋了轉(zhuǎn)錄因子或 RNA 聚合酶與 DNA 的結(jié)合,從而抑制轉(zhuǎn)錄。將dCas9與轉(zhuǎn)錄調(diào)控因子如KRAB的抑制區(qū)融合,可抑制靶基因,這就是CRISPRi(CRISPR interference);dCas9也可與VP64的激活區(qū)結(jié)合,激活靶基因。dCas9的這種特異性調(diào)控功能,與 RNA-seq相結(jié)合,可以用于許多基因功能相關(guān)的研究。CRISPRi用于真核生物時(shí)甚至比RNAi還具有優(yōu)勢(shì)。
不通過RNA-seq這種方法,CRISPR/Cas9技術(shù)與高通量DNA測(cè)序結(jié)合也可進(jìn)行功能基因組學(xué)研究。國內(nèi)外一些研究者已經(jīng)通過CRISPR/Cas9技術(shù)建立可能與某類功能相關(guān)的突變體庫,通過功能性篩選和富集、PCR擴(kuò)增以及深度測(cè)序分析,確認(rèn)與這類功能相關(guān)的基因。
3. 新一代測(cè)序的結(jié)果,為CRISPR/Cas9技術(shù)的應(yīng)用提供了對(duì)象
新一代測(cè)序技術(shù)既可以在全基因組或全轉(zhuǎn)錄組范圍內(nèi)篩選出基因或其轉(zhuǎn)錄產(chǎn)物的變化,也可以在某個(gè)局部范圍(如外顯子組內(nèi))考察基因的變異。這項(xiàng)技術(shù)適合在其它線索很少的情況下(如基因位置信息)篩選出與某些功能相關(guān)的、變異的目標(biāo)基因。這些目標(biāo)基因的具體功能可以用CRISPR/Cas9技術(shù)進(jìn)行研究。
例如,CRISPR/Cas9技術(shù)與高通量測(cè)序技術(shù)相結(jié)合,在藥物開發(fā)中可用于快速發(fā)現(xiàn)藥物的靶標(biāo)并進(jìn)行有效、直觀的驗(yàn)證。這對(duì)探究藥物的藥理、毒理或細(xì)胞的抗藥機(jī)理非常有意義。它是一種可用于反向遺傳學(xué)的技術(shù),可以從另一角度驗(yàn)證正向遺傳學(xué)的結(jié)果。先用藥物處理細(xì)胞,選出藥物抗性克隆,對(duì)這些克隆進(jìn)行新一代測(cè)序,找出候選的基因突變,這些基因的產(chǎn)物可能是藥物的靶標(biāo)。如何確認(rèn)某一(或某些)候選基因突變導(dǎo)致藥物抗性?研究者們采用CRISPR/Cas9技術(shù)突變這一(或這些)基因,觀察細(xì)胞是否出現(xiàn)抗性。在這類研究中,用新一代測(cè)序大范圍內(nèi)快速發(fā)現(xiàn)候選的基因突變,非常有必要。有些研究者通過對(duì)基因組測(cè)序發(fā)現(xiàn)侯選的突變;有人則為了兼顧研究基因表達(dá)情況,采用了轉(zhuǎn)錄組測(cè)序的方法進(jìn)行突變檢測(cè)。
再如,對(duì)于腫瘤組織與癌旁組織進(jìn)行轉(zhuǎn)錄組測(cè)序,選出某些差異基因,再用CRISPR/Cas9 系統(tǒng)驗(yàn)證這些基因的功能,也是對(duì)腫瘤相關(guān)基因進(jìn)行研究的一條策略。
總之,新一代測(cè)序可以為許多進(jìn)一步的研究(包括利用CRISPR/Cas9技術(shù)的研究)找到切入點(diǎn)。
4. 新一代測(cè)序可以用于研究自然界存在的更多物種的CRISPR/Cas 系統(tǒng)
CRISPR/Cas 是一類基于基因的功能系統(tǒng),它自身也可以用新一代測(cè)序技術(shù)加以研究。前文已提到,自然存在的CRISPR/Cas 系統(tǒng)有多種類型,CRISPR/Cas9只是其中的一類。深入研究和了解不同類型的CRISPR/Cas 對(duì)于充分認(rèn)識(shí)和利用這類系統(tǒng)很有必要。譬如,利用RNA-seq 技術(shù),有人在不同的微生物發(fā)現(xiàn)新的CRISPR位點(diǎn);有人則用RNA-seq 探索了CRISPR RNA 的加工(processing)和調(diào)節(jié)機(jī)制。也有作者利用高通量測(cè)序技術(shù)研究了CRISPR位點(diǎn)間隔區(qū)(spacer)的獲取機(jī)制。
五.結(jié)語
新一代測(cè)序技術(shù)和CRISPR/Cas9基因組編輯技術(shù),是進(jìn)入二十一世紀(jì)十幾年來先后發(fā)展出來的兩項(xiàng)影響較大的遺傳學(xué)研究技術(shù)。像PCR技術(shù)一樣,兩者已經(jīng)大大推動(dòng)了生命科學(xué)相關(guān)領(lǐng)域的研究。在科研中將兩者有效地聯(lián)用,不但可以帶來事半功倍的效果,也有助于解決許多懸而未決的技術(shù)問題。