引物,是一小段單鏈DNA或RNA,作為DNA復(fù)制的起始點,在核酸合成反應(yīng)時,作為每個多核苷酸鏈進(jìn)行延伸的出發(fā)點而起作用的多核苷酸鏈,在引物的3′-OH上,核苷酸以二酯鏈形式進(jìn)行合成,因此引物的3′-OH,必須是游離的。
類型
存在有自然中生物的DNA復(fù)制引物(RNA引物)和聚合酶鏈?zhǔn)椒磻?yīng)(PCR)中人工合成的引物(通常為DNA引物)。一般所說引物,指DNA引物,以下簡稱引物。
引物是人工合成的兩段寡核苷酸序列,一個引物與感興趣區(qū)域一端的一條DNA模板鏈互補(bǔ),另一個引物與感興趣區(qū)域另一端的另一條DNA模板鏈互補(bǔ)。
在PCR(聚合酶鏈?zhǔn)椒磻?yīng))技術(shù)中,已知一段目的基因的核苷酸序列,根據(jù)這一序列合成引物,利用PCR擴(kuò)增技術(shù),目的基因DNA受熱變性后解鏈為單鏈,引物與單鏈相應(yīng)互補(bǔ)序列結(jié)合,然后在DNA聚合酶作用下進(jìn)行延伸,如此重復(fù)循環(huán),延伸后得到的產(chǎn)物同樣可以和引物結(jié)合。
PCR引物設(shè)計的目的是找到一對合適的核苷酸片段,使其能有效地擴(kuò)增模板DNA序列。如前述,引物的優(yōu)劣直接關(guān)系到PCR的特異性與成功與否。對引物的設(shè)計不可能有一種包羅萬象的規(guī)則確保PCR的成功,但遵循某些原則,則有助于引物的設(shè)計。
1.引物最好在模板cDNA的保守區(qū)內(nèi)設(shè)計。
DNA序列的保守區(qū)是通過物種間相似序列的比較確定的。在NCBI上搜索不同物種的同一基因,通過序列分析軟件(比如DNAman)比對(Alignment),各基因相同的序列就是該基因的保守區(qū)。
2.引物長度一般在15~30堿基之間。
引物長度(primer length)常用的是18-27 bp,但不應(yīng)大于38,因為過長會導(dǎo)致其延伸溫度大于
3.引物GC含量在40%~60%之間,Tm值最好接近
GC含量(composition)過高或過低都不利于引發(fā)反應(yīng)。上下游引物的GC含量不能相差太大。另外,上下游引物的Tm值(melting temperature)是寡核苷酸的解鏈溫度,即在一定鹽濃度條件下,50%寡核苷酸雙鏈解鏈的溫度。有效啟動溫度,一般高于Tm值5~
4.引物3′端要避開密碼子的第3位。
如擴(kuò)增編碼區(qū)域,引物3′端不要終止于密碼子的第3位,因密碼子的第3位易發(fā)生簡并,會影響擴(kuò)增的特異性與效率。
5.引物3′端不能選擇A,最好選擇T。
引物3′端錯配時,不同堿基引發(fā)效率存在著很大的差異,當(dāng)末位的堿基為A時,即使在錯配的情況下,也能有引發(fā)鏈的合成,而當(dāng)末位鏈為T時,錯配的引發(fā)效率大大降低,G、C錯配的引發(fā)效率介于A、T之間,所以3′端最好選擇T。
6. 堿基要隨機(jī)分布。
引物序列在模板內(nèi)應(yīng)當(dāng)沒有相似性較高,尤其是
7. 引物自身及引物之間不應(yīng)存在互補(bǔ)序列。
引物自身不應(yīng)存在互補(bǔ)序列,否則引物自身會折疊成發(fā)夾結(jié)構(gòu)(Hairpin)使引物本身復(fù)性。這種二級結(jié)構(gòu)會因空間位阻而影響引物與模板的復(fù)性結(jié)合。引物自身不能有連續(xù)4個堿基的互補(bǔ)。
兩引物之間也不應(yīng)具有互補(bǔ)性,尤其應(yīng)避免3′ 端的互補(bǔ)重疊以防止引物二聚體(Dimer與Cross dimer)的形成。引物之間不能有連續(xù)4個堿基的互補(bǔ)。 引物二聚體及發(fā)夾結(jié)構(gòu)如果不可避免的話,應(yīng)盡量使其△G值不要過高(應(yīng)小于4.5kcal/mol)。否則易導(dǎo)致產(chǎn)生引物二聚體帶,并且降低引物有效濃度而使PCR 反應(yīng)不能正常進(jìn)行。
8. 引物5′ 端和中間△G值應(yīng)該相對較高,而3′ 端△G值較低。
△G值是指DNA 雙鏈形成所需的自由能,它反映了雙鏈結(jié)構(gòu)內(nèi)部堿基對的相對穩(wěn)定性,△G值越大,則雙鏈越穩(wěn)定。應(yīng)當(dāng)選用5′ 端和中間△G值相對較高,而3′ 端△G值較低(絕對值不超過9)的引物。引物3′ 端的△G 值過高,容易在錯配位點形成雙鏈結(jié)構(gòu)并引發(fā)DNA 聚合反應(yīng)。(不同位置的△G值可以用Oligo 6軟件進(jìn)行分析)
9.引物的5′端可以修飾,而3′端不可修飾。
引物的5′ 端決定著PCR產(chǎn)物的長度,它對擴(kuò)增特異性影響不大。因此,可以被修飾而不影響擴(kuò)增的特異性。引物5′ 端修飾包括:加酶切位點;標(biāo)記生物素、熒光、地高辛、Eu3+等;引入蛋白質(zhì)結(jié)合DNA序列;引入點突變、插入突變、缺失突變序列;引入啟動子序列等。
引物的延伸是從3′ 端開始的,不能進(jìn)行任何修飾。3′ 端也不能有形成任何二級結(jié)構(gòu)可能。
10. 擴(kuò)增產(chǎn)物的單鏈不能形成二級結(jié)構(gòu)。
某些引物無效的主要原因是擴(kuò)增產(chǎn)物單鏈二級結(jié)構(gòu)的影響,選擇擴(kuò)增片段時最好避開二級結(jié)構(gòu)區(qū)域。用有關(guān)軟件(比如RNAstructure)可以預(yù)測估計mRNA的穩(wěn)定二級結(jié)構(gòu),有助于選擇模板。實驗表明,待擴(kuò)區(qū)域自由能(△G°)小于
11. 引物應(yīng)具有特異性。
引物設(shè)計完成以后,應(yīng)對其進(jìn)行BLAST檢測。如果與其它基因不具有互補(bǔ)性,就可以進(jìn)行下一步的實驗了。
值得一提的是,各種模板的引物設(shè)計難度不一。有的模板本身條件比較困難,例如GC含量偏高或偏低,導(dǎo)致找不到各種指標(biāo)都十分合適的引物;用作克隆目的的PCR,因為產(chǎn)物序列相對固定,引物設(shè)計的選擇自由度較低。在這種情況只能退而求其次,盡量去滿足條件。
做Real Time時,用于SYBR Green I法時的一對引物與一般PCR的引物,在引物設(shè)計上所要求的參數(shù)是不同的。引物設(shè)計的要求:
●避免重復(fù)堿基,尤其是G.
●Tm=58-60度。
●GC=30-80%.
●3'端最后5個堿基內(nèi)不能有多于2個的G或C.
●正向引物與探針離得越近越好,但不能重疊。
●PCR擴(kuò)增產(chǎn)物長度: 引物的產(chǎn)物大小不要太大,一般在80-250bp之間都可;80~150 bp最為合適(可以延長至300 bp)。
●引物的退火溫度要高,一般要在60度以上;
要特別注意避免引物二聚體和非特異性擴(kuò)增的存在。
而且引物設(shè)計時應(yīng)該考慮到引物要有不受基因組DNA污染影響的能力,即引物應(yīng)該跨外顯子,最好是引物能跨外顯子的接頭區(qū),這樣可以更有效的不受基因組DNA污染的影響。
做染料法最關(guān)鍵的就是尋找到合適的引物和做污染的預(yù)防工作。對于引物,你要有從一大堆引物中挑出一兩個能用的引物的思想準(zhǔn)備---尋找合適的引物非常不容易。
關(guān)于BLAST的作用應(yīng)該是通過比對,發(fā)現(xiàn)你所設(shè)計的這個引物,在已經(jīng)發(fā)現(xiàn)并在GENEBANK中公開的不物種基因序列當(dāng)中,除了和你的目標(biāo)基因之外,還有沒有和其他物種或其他序列當(dāng)中存在相同的序列,如和你的目標(biāo)序列之外的序列相同的序列,則可能擴(kuò)出其他序列的產(chǎn)物,那么這個引物的特異性就很差,從而不能用。
■Oligo 6
Oligo 6是目前使用最為廣泛的一款引物設(shè)計軟件,除了可以簡單快捷地完成各種引物和探針的設(shè)計與分析外,還具有很多其他同類軟件所不具有的高級功能:
● 已知一個PCR引物的序列,搜尋和設(shè)計另一個引物的序列;
●按照不同的物種對MM子的偏好性設(shè)計簡并引物;
● 對環(huán)型DNA片段,設(shè)計反向PCR引物;
●設(shè)計多重PCR引物;
●為LCR反應(yīng)設(shè)計探針,以檢測某個突變是否出現(xiàn);
●分析和評價用其他途徑設(shè)計的引物是否合理;
●同源序列查找,并根據(jù)同源區(qū)設(shè)計引物;
●增強(qiáng)了的引物/探針?biāo)褜な侄巍TO(shè)計引物過程中,可以"Lock"每個參數(shù),如Tm值范圍和引物
● 以多種形式存儲結(jié)果;支持多用戶,每個用戶可保存自己的特殊設(shè)置。
■Primer Premier 5.0
Primer Premier 5.0 是一種用來幫助研究人員設(shè)計最適合引物的應(yīng)用軟件利用它的高級引物搜索引物數(shù)據(jù)庫巢式引物設(shè)計引物編輯和分析等功能可以設(shè)計出有高效擴(kuò)增能力的理想引物也可以設(shè)計出用于擴(kuò)增長達(dá)50kb以上的PCR產(chǎn)物的引物序列。
該軟件主要由GeneTank 序列編輯,Primer 引物設(shè)計,Align 序列比較,Enzyme 酶切分析和Motif 基序分析等幾個主要功能板塊組成。