CRISPR/Cas9已經(jīng)成為最常用的基因編輯系統(tǒng)。CRISPR/Cas9包括2部分:Cas9核酸內(nèi)切酶和sgRNA(single guide RNA),sgRNA由天然的tracrRNA (transactivating crRNA)和crRNA (CRISPR RNA)融合而來。
使用CRISPR/Cas9工具進(jìn)行基因敲除等基因編輯時(shí),首先要進(jìn)行sgRNA設(shè)計(jì)。理論上只要根據(jù)PAM序列(SpCas9識(shí)別的最佳PAM是5-NGG-3)對(duì)所需靶向的物種基因組進(jìn)行掃描,即可設(shè)計(jì)所有可能的sgRNA。但如何設(shè)計(jì)合理有效的sgRNA則需要謹(jǐn)慎考慮,因?yàn)檫@將決定其基因編輯結(jié)果。
圖1 CRISPR/Cas9系統(tǒng)[2]
隨著近年來研究的不斷深入,研究者對(duì)CRISPR/Cas9系統(tǒng)機(jī)制已有非常全面的了解。這些研究結(jié)果也促進(jìn)了大量的sgRNA設(shè)計(jì)工具的出現(xiàn)[1,3],從而給研究者提供了快速、高效的sgRNA設(shè)計(jì)選擇。
sgRNA的5’包括20nt的protospacer序列,該序列和靶向DNA序列互補(bǔ)以實(shí)現(xiàn)雙鏈切割;其3’則為固定的一段具有莖環(huán)(stem-loop)結(jié)構(gòu)的支架序列(scaffold sequence),該序列和Cas9蛋白帶正電的凹槽相互作用形成核糖核蛋白復(fù)合物(ribonucleoprotein complex, RNP)。一般sgRNA序列大多指20nt的protospacer序列。
大部分的sgRNA設(shè)計(jì)工具,除展示設(shè)計(jì)序列外,主要包括效率和特異性評(píng)價(jià),并給出參考評(píng)價(jià)分值。而不同工具所基于的數(shù)據(jù)和算法,導(dǎo)致給出特異性和效率結(jié)果可能不同。由于sgRNA特異性主要取決于是否存在潛在的錯(cuò)配序列,不同工具間結(jié)果一致性往往較高;但是對(duì)于效率預(yù)測,目前并沒有非常成熟的預(yù)測工具,研究者使用時(shí)需要謹(jǐn)慎參考。
在工具設(shè)計(jì)頁面上,不同的工具偏重點(diǎn)不同。很多工具提供不同的物種基因組序列,可使用基因ID直接獲得sgRNA;或者通過輸入候選序列進(jìn)行sgRNA設(shè)計(jì)。并且大都能提供多種CRISPR/Cas系統(tǒng)以供設(shè)計(jì)。
下面簡單介紹幾種sgRNA設(shè)計(jì)工具:
Broad Institute GPP
(https://portals.broadinstitute.org/gpp/public/analysis-tools/sgrna-design)
較早出現(xiàn)的sgRNA在線設(shè)計(jì)工具,主要基于Doench等人2篇非常全面深入的sgRNA設(shè)計(jì)優(yōu)化研究[4,5],以提供最高效率和最小脫靶可能的sgRNA設(shè)計(jì)。
該工具可應(yīng)用于CRISPRko,CRISPRa(CRISPR activation)和CRISPRi(CRISPR interference)的sgRNA設(shè)計(jì)。提供包括SpCas9、SaCas9、AsCas9和enAsCas9四種CRISPR工具,以及human、mouse和rat三種物種基因組設(shè)計(jì)選擇。該工具可以通過序列直接輸入、基因ID和序列文件導(dǎo)入進(jìn)行設(shè)計(jì)。大部分在線工具同時(shí)能提供在線展示和下載。但該工具設(shè)計(jì)結(jié)果需要下載,不提供在線的結(jié)果展示。
crispr.mit.edu(R.I.P)
曾經(jīng)最為廣泛使用的sgRNA設(shè)計(jì)工具(已于2017關(guān)閉)。提供WT和nickases兩種Cas9的sgRNA設(shè)計(jì)。其優(yōu)點(diǎn)是通過算法預(yù)測,對(duì)設(shè)計(jì)的sgRNA給出高、中、低三個(gè)可用等級(jí)便于使用者快速選擇。其頁面設(shè)計(jì)能快速瀏覽sgRNA的潛在脫靶位點(diǎn),非常受研究者喜愛。
一個(gè)致命問題是該工具過濾了重復(fù)序列區(qū)域(repeat region),這樣如果你的sgRNA序列在基因組上存在多個(gè)重復(fù),該工具并不能提醒。
Deskgen
(https:///landing/#/)
隨著CRISPR/Cas9的服務(wù)提供商的興起,一些企業(yè)推出的sgRNA設(shè)計(jì)工具也非常具備使用性,并且這些工具往往貼合基因編輯設(shè)計(jì),提供體驗(yàn)良好的可視化頁面(比如:synthego,IDT, deskgen)。
其中DESKGEN AI是通過人工智能算法的設(shè)計(jì)工具,屬于較為主流的CRISPR基因組編輯設(shè)計(jì)商業(yè)工具。
CRISPR finder
(https://www.sanger.ac.uk/htgt/wge/find_crisprs)
最大的特點(diǎn)和優(yōu)勢(shì)是可通過ensembl數(shù)據(jù)庫的基因頁面上顯示sgRNA位置,提供基因組標(biāo)注sgRNA瀏覽。便于快速的選定基因組的sgRNA序列。使用filter可快速選擇不同等級(jí)的sgRNA顯示。
crisprgold
(https://crisprgold.mdc-berlin.de/index.php)
該工具獨(dú)特的提出一個(gè)關(guān)于sgRNA活性的見解[9,10],如果protospacer和scaffold序列存在一定的互補(bǔ),則會(huì)產(chǎn)生binding energy,則可能影響正常的sgRNA二級(jí)結(jié)構(gòu),從而影響對(duì)靶序列的識(shí)別和結(jié)合,該工具將這一因素考慮在內(nèi),進(jìn)而可以提供活性更高的sgRNA設(shè)計(jì)。。
DeepHF
(http://www.deephf.com/index/#/Predict)
通過測試人全基因組8萬多個(gè)sgRNA的細(xì)胞系水平活性效率[6],在此數(shù)據(jù)基礎(chǔ)上利用深度學(xué)習(xí)的方法建立了sgRNA效率的預(yù)測模型。與已有的模型相比,具有更準(zhǔn)確的預(yù)測效果。
但值得注意的是,該模型數(shù)據(jù)來源于人的細(xì)胞系,可能并不適用于如小鼠或其他物種預(yù)測。
inDelphi和 FORECasT
(https://indelphi.giffordlab.mit.edu/)
(https://partslab.sanger.ac.uk/FORECasT#results)
以往認(rèn)為,CRISPR/Cas9在無模板的情況下,通過NHEJ產(chǎn)生的修復(fù)結(jié)果是隨機(jī)的indel。但近年多篇研究發(fā)現(xiàn),同一靶點(diǎn)的sgRNA序列存在比較一致的修復(fù)結(jié)果(indel),更進(jìn)一步的發(fā)現(xiàn),一部分的sgRNA的修復(fù)結(jié)果(the outcome of CRISPR-mediated editing)是可以預(yù)測的[7,8]。inDelphi和FORECasT是最近出現(xiàn)的sgRNA無模板編輯預(yù)測工具,這對(duì)研究者準(zhǔn)確設(shè)計(jì)和使用sgRNA,以得到預(yù)期基因編輯目的提供的進(jìn)一步幫助。
當(dāng)前眾多的sgRNA設(shè)計(jì)工具幾乎都是通過大規(guī)模的實(shí)驗(yàn)數(shù)據(jù)集和系統(tǒng)分析,建立相應(yīng)的模型或算法。隨著更多CRISPR / Cas9數(shù)據(jù)集的出現(xiàn),以及結(jié)合人工智能和深度學(xué)習(xí)算法,后續(xù)有望出現(xiàn)更多大數(shù)據(jù)集合、算法優(yōu)化的設(shè)計(jì)工具。
參考文獻(xiàn)
[1]Cui,Yingbo, et al. Review of CRISPR/Cas9 sgRNA Design Tools.Interdisciplinary Sciences: Computational Life Sciences 10.2 (2018): 455-465.
[2]Graham, Daniel B., and David E. Root. Resources for the design of CRISPR gene editing experiments. Genome Biology 16.1 (2015): 260-260.
[3]Lee, Ciaran M., Timothy H. Davis, and Gang Bao. Examination of CRISPR/Cas9 design tools and the effect of target site accessibility on Cas9 activity. Experimental Physiology 103.4 (2017): 456-460.
[4]Doench, John G., et al. Optimized sgRNA design to maximize activity and minimize off-target effects of CRISPR-Cas9. Nature Biotechnology 34.2 (2016): 184-191.
[5]Sanson, Kendall R., et al. Optimized libraries for CRISPR-Cas9 genetic screens with multiple modalities. Nature Communications 9.1 (2018).
[6]Wang, Daqi, et al. Optimized CRISPR guide RNA design for two high-fidelity Cas9 variants by deep learning. Nature Communications 10.1 (2019): 1-14.
[7]Shen, Max W., et al. Predictable and precise template-free CRISPR editing of pathogenic variants.. Nature 563.7733 (2018): 646-651.
[8]Chakrabarti, Anob M., et al. Target-Specific Precision of CRISPR-Mediated Genome Editing. Molecular Cell 73.4 (2019).
[9]Chu, Van Trung, et al. Efficient CRISPR-mediated mutagenesis in primary immune cells using CrispRGold and a C57BL/6 Cas9 transgenic mouse line.Proceedings of the National Academy of Sciences of the United States of America 113.44 (2016): 12514-12519.
[10]Graf, Robin, et al. sgRNA Sequence Motifs Blocking Efficient CRISPR/Cas9-Mediated Gene Editing. Cell Reports 26.5 (2019).
掃碼關(guān)注百奧賽圖了解更多資訊哦