引物设计的原则汇总
引物设计的原则汇总
分类: 基因组学的研究方法 一、引物设计step by step1、在NCBI上搜索到目的基因,找到该基因的mRNA,在CDS选项中,找到编码区所在位置,在下面的origin中,Copy该编码序列作为软件查询序列的候选对象。
2、用Primer Premier5搜索引物
①打开Primer Premier5,点击File-New-DNA sequence, 出现输入序列窗口,Copy目的序列在输入框内(选择As),此窗口内,序列也可以直接翻译成蛋白。点击Primer,进入引物窗口。
②此窗口可以链接到“引物搜索”、“引物编辑”以及“搜索结果”选项,点击Search按钮,进入引物搜索框,选择“PCR primers”,“Pairs”,设定搜索区域和引物长度和产物长度。在Search Parameters里面,可以设定相应参数。一般若无特殊需要,参数选择默认即可,但产物长度可以适当变化,因为100~200bp的产物电泳跑得较散,所以可以选择 300~500bp.
③点击OK,软件即开始自动搜索引物,搜索完成后,会自动跳出结果窗口,搜索结果默认按照评分(Rating)排序,点击其中任一个搜索结果,可以在“引物窗口”中,显示出该引物的综合情况,包括上游引物和下游引物的序列和位置,引物的各种信息等。
④对于引物的序列,可以简单查看一下,避免出现下列情况: 3’不要出现连续的3个碱基相连的情况,比如GGG或 CCC,否则容易引起错配。此窗口中需要着重查看的包括:Tm应该在55~70度之间,GC%应该在45%~55%间,上游引物和下游引物的Tm值最好不要相差太多,大概在2度以下较好。该窗口的最下面列出了两条引物的二级结构信息,包括,发卡,二聚体,引物间交叉二聚体和错误引发位置。若按钮显示为红色,表示存在该二级结构,点击该红色按钮,即可看到相应二级结构位置图示。最理想的引物,应该都不存在这些二级结构,即这几个按钮都显示为“None”为好。但有时很难找到各个条件都满足的引物,所以要求可以适当放宽,比如引物存在错配的话,可以就具体情况考察该错配的效率如何,是否会明显影响产物。对于引物具体详细的评价需要借助于Oligo来完成,Oligo自身虽然带有引物搜索功能,但其搜索出的引物质量感觉不如Primer5.
⑤在Primer5窗口中,若觉得某一对引物合适,可以在搜索结果窗口中,点击该引物,然后在菜单栏,选择File-Print-Current pair,使用PDF虚拟打印机,即可转换为Pdf文档,里面有该引物的详细信息。
3、用Oligo验证评估引物
①在Oligo软件界面,File菜单下,选择Open,定位到目的cDNA序列(在primer中,该序列已经被保存为Seq文件),会跳出来两个窗口,分别为Internal Stability(Delta G)窗口和Tm窗口。在Tm窗口中,点击最左下角的按钮,会出来引物定位对话框,输入候选的上游引物序列位置(Primer5已经给出)即可,而引物长度可以通过点击Change-Current oligo length来改变。定位后,点击Tm窗口的Upper按钮,确定上游引物,同样方法定位下游引物位置,点击Lower按钮,确定下游引物。引物确定后,即可以充分利用Analyze菜单中各种强大的引物分析功能了。
②Analyze中,第一项为Key info,点击Selected primers,会给出两条引物的概括性信息,其中包括引物的Tm值,此值Oligo是采用nearest neighbor method计算,会比Primer5中引物的Tm值略高,此窗口中还给出引物的Delta G和3’端的Delta G.3’端的
Delta G过高,会在错配位点形成双链结构并引起DNA聚合反应,因此此项绝对值应该小一些,最好不要超过9。
③Analyze中第二项为Duplex Formation,即二聚体形成分析,可以选择上游引物或下游引物,分析上游引物间二聚体形成情况和下游引物间的二聚体情况,还可以选择
Upper/Lower ,即上下游引物之间的二聚体形成情况。引物二聚体是影响PCR反应异常的重要因素,因此应该避免设计的引物存在二聚体,至少也要使设计的引物形成的二聚体是不稳定的,即其Delta G值应该偏低,一般不要使其超过4.5kcal/mol,结合碱基对不要超过3个。Oligo此项的分析窗口中分别给出了3’端和整个引物的二聚体图示和Delta G值。
④Analyze中第三项为Hairpin Formation,即发夹结构分析。可以选择上游或者下游引物,同样,Delta G值不要超过4.5kcal/mol,碱基对不要超过3个。
Analyze中第四项为Composition and Tm,会给出上游引物、下游引物和产物的各个碱基的组成比例和Tm值。上下游引物的GC%需要控制在40%~60%,而且上下游引物之间的GC%不要相差太大。Tm值共有3个,分别采用三种方法计算出来,包括nearest neighbor method、%GC method和2(A+T)+4(G+C)method,最后一种应该是Primer5所采用的方法,Tm 值可以控制在50~70度之间。
第五项为False Priming Sites,即错误引发位点,在Primer5中虽然也有False priming分析,但不如oligo详细,并且oligo会给我正确引发效率和错误引发效率,一般的原则要使误引发效率在100以下,当然有时候正确位点的引发效率很高的话,比如达到400~500,错误引发效率超过100幅度若不大的话,也可以接受。
⑤Analyze中,有参考价值的最后一项是“PCR”,在此窗口中,是基于此对引物的PCR反应Summary,并且给出了此反应的最佳退火温度,另外,提供了对于此对引物的简短评价。若该引物有不利于PCR反应的二级结构存在,并且Delta G值偏大的话,Oligo在最后的评价中会注明,若没有注明此项,表明二级结构能值较小,基本可以接受。
⑥引物评价完毕后,可以选择File-Print,打印为PDF文件保存,文件中将会包括所有Oligo软件中已经打开的窗口所包括的信息,多达数页。因此,打印前最好关掉Tm窗口和Delta G窗口,可以保留引物信息窗口、二级结构分析窗口(若存在可疑的异常的话)和PCR窗口。
4、引物确定后,对于上游和下游引物分别进行Blast分析,一般来说,多少都会找到一些其他基因的同源序列,此时,可以对上游引物和下游引物的blast结果进行对比分析,只要没有交叉的其他基因的同源序列就可以。
二、引物设计过程中的心得
1、Primer 5.0搜索引物
①Primer Length我常设置在18-30bp,短了特异性不好,长了没有必要。当然有特殊要求的除外,如加个酶切位点什么的。
②PCR Product size最好是100-500bp之间,小于100bp的PCR产物琼脂糖凝胶电泳出来,条带很模糊,不好看。至于上限倒也不必要求苛刻。
③Search parameters还是选Manual吧,Search stringency应选High,GC含量一般是40-60%。其它参数默认就可以了。
④搜索出来的引物,按Rating排序,逐个送Oligo软件里评估。当然,搜索出的引物,其扩增产物很短,你可以不选择它,或是引物3端≥2个A或T,或引物内部连续的G或C太多,或引物3端≥2个G或C,这样的引物应作为次选,没得选了就选它。对于这样的引物,如果其它各项指标还可以,我喜欢在引物末端去掉一个不满意的或加上一个碱基,看看引物的评估参数有没有变好点。
2、Oligo 6.0评估引物
①在analyze里,Duplex Formation不管是上游引物、下游引物还是上下游引物之间,The most stable 3’-Dimer绝对值应小于4.5kcal/mol, The most stable Dimer overall绝对值一般应小于多少kcal/mol跟PCR退火温度有关,我几次实验感觉在PCR退火温度在65°的时候,The most stable Dimer overall 6.7kcal/mol没有问题。
②Hairpin Formation根据黄金法则
③False priming sites: Primer的priming efficiency应该是错配地方的4倍左右,更多当然更好。
④在PCR栏,丁香园战友感觉其所显示的optimal annealing temperature数值值得参考。在PCR摸索条件的时候,退火温度为其数值加减2的范围就可以了。
⑤Internal stability很重要:我们希望引物的内部稳定性是中间高、两边低的弧形,最起码保证3端不要过于稳定。下图引物3端过于稳定,很容易导致不适当扩增。△G参照黄金法则,这其实很好理解:把一滴水放到大海里,这滴水就会不停的扩散分布,扩散的越厉害越稳定,所以△G绝对值越大结构越稳定。
3、其他
①两个评价系统不一样,丁香园战友感觉oligo评价引物好点,primer出来的引物,一般按效率排序,再结合退火温度和引物长度,选择引物到oligo测试。这是初步的选择,其实引物到了oligo里,退火温度也不一样。
②3端的二聚体应该避免,这个要看退火温度决定,一个50°的退火温度肯定和65°对二聚体的影响不一样了,一般来讲尽量控制在-4.5kcal/mol以下(丁香园战友观点,很多东西真得还是需要自己摸索)。
③丁香园战友感觉3端有A无A影响不大,3端有T是不是一定不行,不见得。软件是评估,法则也不是没有例外,不是1+1=2那么确定。
④错配和二聚体谁轻谁重,丁香园战友觉得“到致命的程度”谁都重要,在设计的时候,尽量两个都不得罪。
⑤GC含量并非不重要,它直接影响引物各端稳定性,3端来两个G或C,稳定性就上去了,粘在模板上很牢。所以丁香园战友设计引物的时候,会尽量避免这样的情况出现。
除了前引物和后引物的Tm不能相差太大,我们还要重点考虑以下因素:
一、GC% GC含量
对于PCR反应来说GC含量在40%—60%,一般50%左右比较合适;而对于测序引物和杂交探针来说GC含量至少应为50%。产物中GC含量最好大于引物中的GC含量。
二、Degeneracy 多义性
当设计多义引物时应尽量减少引物多义性,这样会带来更好的特异性,应尽量避免3末端的多义性,因为这里即使一个碱基的错配都能阻止引物延伸。
三、3’ End Stability 3 末端稳定性
引物稳定性影响它的错配效率,一条理想的引物应该有一个稳定性较强的5 末端和相对稳定性较弱的3 末端。如果引物3 稳定性强,有可能在即使5 末端不配对的情况下造成错配,形成非特异性扩增条带(secondary bands) 。而3 末端稳定性低的引物较好的原因是在引物发生错配时,由于3 末端不太稳定引物结合不稳定而难以延伸。
四、GC Clamp GC钳
引物与目的位点的有效结合需要有稳定的5 末端。这一段有较强稳定性的5 末端称为GC钳。它保证引物与模板的稳定结合。选择有合适稳定性的引物能在确保不产生非特异性条带的前提下尽量降低退火温度。
五、Secondary Structures 二级结构
二级结构是引物设计中必须考虑的一个重要因素。二级结构能显著影响反应中能与模板正确结合的引物数量,发卡结构的存在能限制引物与目的位点的结合能力,从而降低扩增效率,形成发卡环的引物则不能在PCR扩增中发挥作用。
六、Hairpin 发卡结构
发卡结构的形成是由于引物自身的互补碱基分子内配对造成引物折叠形成的二级结构,并由于发卡结构的形成是分子内的反应,仅仅需要三个连续碱基配对就可以形成。发卡结构的稳定性可以用自由能衡量。自由能大小取决于碱基配对释放的能量以及折叠DNA形成发卡环所需要的能量,如果自由能值大于0 则该结构不稳定从而不会干扰反应,如果自由能值小于0 则该结构可以干扰反应。
七、Dimer 二聚体
引物之间的配对区域能形成引物二聚体,它是相同或不同的两条引物之间形成的二级结构。它造成引物二聚体扩增并减少目的扩增产物,二聚体可以在序列相同的两条引物或正反向引物之间形成,如果配对区域在3 末端问题会更为严重,3 末端配对很容易引起引物二聚体扩增。
八、False Priming 错配
如果引物可以结合除目的位点外的其他区域,扩增效率将明显降低目的产物带将减少或出现涂布(smear)。3 末端连续几个碱基配对形成错配的倾向要高于引物上游区域同样数量的碱基配对,在使用引物设计软件时,您可以分别设定确认为错配的3 末端或引物全长形成连续碱基配对的数量。
顺便说一下,如果是新手,刚开始接触引物设计,推荐使用Primer Premier 5.0,因为它界面简单,易学易用;如果你想把引物设计得尽善尽美,公认的首选软件是Oligo,其次我认为是DNAstar。Oligo功能强大,所以使用起来就没有Primer Premier 5.0那么简便。先用Primer Premier 5.0设计,然后把设计好的引物拿到Oligo里去检测这对引物的优劣,我想这对大多数引物设计者是一个不错的选择!
补充一:具体说一下引物中GC含量问题
引物的GC含量一般为40-60%,以45-55%为宜,过高或过低都不利于引发反应。有一些模板本身的GC 含量偏低或偏高,导致引物的GC含量不能在上述范围内,这时应尽量使上下游引物的GC 含量以及Tm 值保持接近(上下游引物的GC含量不能相差太大),以有利于退火温度的选择。如果G-C比例超出,则在引物的5’端增加As或Ts;而如果A-T比例过高,则同样在5’端增加Gs或Cs。但也有认为:原来普遍认为PCR引物应当有50%的GC/AT比率的观点其实是不对的,以人基因组DNA为模板,用81%AT的引物可以产生单一的、专一的、长250 bp,含有70% AT的产物。完全没有必要复杂地去计算产物和引物的解链温度,PCR引物的GC/AT比率应当等于或高于所要放大的模板的GC/AT比
补充二:关于自由能问题(如何根据自由能判断引物质量)
1、ΔG值(自由能)反映了引物与模板结合的强弱程度。一般情况下,引物的ΔG值最好呈正弦曲线形状,即5’端和中间ΔG值较高,而3’端ΔG值相对较低,且不要超过9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。3′末端双链的ΔG是0~-2 kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%、到-8时少于20%、而-10时接近于0。
2、引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带而且会降低引物浓度从而导致PCR 正常反应不能进行,与二聚体相关的一个参数是碱基的分布,3’端的连续GGG 或CCC 会导致错误引发。二聚体形成的能值越高越稳定,越不符合要求。与二聚体相同,发夹结构的能值越低越好。虽然有些带有发夹环,其ΔG为-3 kcal/mol的自身互补引物也可以得到不错的结果,但是如果它的3′末端被发夹环占据时就很麻烦,
即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。当然,如果发夹环在5′末端对反应就没有多大的影响了。
补充三:关于产物需要测序的PCR引物的设计问题
在DNA测序的PCR中最好用5′末端稳定(如GC含量较多),而3′末端不太稳定(如AT含量较多)的引物,这种引物的结构可以有效地消除假引发反应。这就是基于引物内部稳定性的经验之谈。其3′末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在3′末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发DNA合成,所以不会产生假产物。因此,为了有效地引发反应,引物的5′末端和中央部分必须与靶DNA也形成双链。与此相反,带有稳定的、GC丰富的3′末端的寡核苷酸不需要其所有的核苷酸序列都与靶序列配对,只凭借其3′末端与靶序列任何位点的牢固配合就可以引发反应,产生非专一产物。无论如何,寡核苷酸3′末端最后5个核苷酸的稳定性小于-9 kcal/mol的,通常就是专一性的探针或引物。寡核苷酸3′末端越不稳定,假引发的可能性越低。
首先引物要跟模板紧密结合,其次引物与引物之间不能有稳定的二聚体或发夹结构存在,再次引物不能在别的非目的位点引起DNA聚合反应(即错配)。围绕这几条基本原则,设计引物需要考虑诸多因素,如引物长度(primer length)、产物长度(product length)、序列Tm值(melting temperature)、ΔG值(internal stability)、引物二聚体及发夹结构(duplex formation and hairpin)、错误引发位点(false priming site)、引物及产物GC 含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。以使用Oligo 软件分析设计引物为例,1. 引物的长度一般为15-30bp,常用的是18-27bp,但不能大于38,因为过长会导致其延伸温度大于74℃,即Taq 酶的最适温度。
2. 引物3’端的序列要比5’端重要。引物3’端的碱基一般不用A(3’端碱基序列最好是G、C、CG、GC),因为A在错误引发位点的引发效率相对比较高。另外引物间3’端的互补、二聚体或发夹结构也可能导致PCR反应失败。5’端序列对PCR 影响不大,因此常用来引进修饰位点或标记物。
3. 引物的GC含量一般为40-60%,以45-55%为宜,过高或过低都不利于引发反应。有一些模板本身的GC 含量偏低或偏高,导致引物的GC含量不能在上述范围内,这时应尽量使上下游引物的GC 含量以及Tm 值保持接近(上下游引物的GC含量不能相差太大),以有利于退火温度的选择。如果G-C比例超出,则在引物的5’端增加As或Ts;而如果A-T比例过高,则同样在5’端增加Gs或Cs。但也有认为:原来普遍认为PCR引物应当有50%的GC/AT比率的观点其实是不对的,以人基因组DNA为模板,用81%AT的引物可以产生单一的、专一的、长250 bp,含有70% AT的产物。完全没有必要复杂地去计算产物和引物的解链温度,PCR引物的GC/AT比率应当等于或高于所要放大的模板的GC/AT比。
4. 引物所对应模板序列的Tm 值最好在72℃左右。(Tm 值曲线以选取72 度附近为佳,5’到3’的下降形状也有利于引物引发聚合反应),至少要在55-80℃之间
5. ΔG值(自由能)反映了引物与模板结合的强弱程度。一般情况下,引物的ΔG值最好呈正弦曲线形状,即5’端和中间ΔG值较高,而3’端ΔG值相对较低,且不要超过9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。3′末端双链的ΔG是0~-2 kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%、到-8时少于20%、而-10时接近于0。
6. 可能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错误引发率高,错误引发的引发率一般不要高过100,如此可保证不出现非目的产物的假带。但对于特定的模板序列,还应结合比较其在正确位点的引发效率。如果两者相差很大,比如在正确位点的引发效率为450 以上,而在错误位点的引发效率为130,并且不好找其他更合适的引物,那么这对引物也是可以接受的。
7. Frq 曲线为Oligo6新引进的一个指标,揭示了序列片断存在的重复机率大小。选取引物时,宜选用Frq 值相对较低的片断。
8. 引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带而且会降低引物浓度从而导致PCR 正常反应不能进行,与二聚体相关的一个参数是碱基的分布,3’端的连续GGG 或CCC 会导致错误引发。二聚体形成的能值越高越稳定,越不符合要求。与二聚体相同,发夹结构的能值越低越好。虽然有些带有发夹环,其ΔG为-3 kcal/mol的自身互补引物也可以得到不错的结果,但是如果它的3′末端被发夹环占据时就很麻烦,即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。当然,如果发夹环在5′末端对反应就没有多大的影响了。
9. 以公式(4×G/C + 2×A/T-5)计算Tm值,即退火温度。选择较低Tm值的引物的退火温度为反应的退火温度。4-6℃的差别似乎对PCR产量影响不大。最好,保证每个引物的Tm值相匹配,且在70-75℃范围内
10. 要知道,更重要的因素是模板与稳定性较小的引物之间解链温度的差异。差异越小,PCR的效率越高。因为DNA的解链温度也取决于它的长度,所以有的研究者喜欢设计很长,而不求它很稳定的引物。可是,引物太长就难以避免形成二聚体和自身互补,因此,一般还是不用为好。如果期待的产物长度等于或小于500 bp,选用短的(16~18 mer)的引物:若产物长5 kb,则用24 mer的引物。有人用20~23 mer引物得到40 kb的产物。
11. 在DNA测序和PCR中最好用5′末端稳定(如GC含量较多),而3′末端不太稳定(如AT含量较多)的引物,这种引物的结构可以有效地消除假引发反应。这就是基于引物内部稳定性的经验之谈。其3′末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在3′末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发DNA合成,所以不会产生假产物。因此,为了有效地引发反应,引物的5′末端和中央部分必须与靶DNA也形成双链。与此相反,带有稳定的、GC丰富的3′末端的寡核苷酸不需要其所有的核苷酸序列都与靶序列配对,只凭借其3′末端与靶序列任何位点的牢固配合就可以引发反应,产生非专一产物。无论如何,寡核苷酸3′末端最后5个核苷酸的稳定性小于-9 kcal/mol的,通常就是专一性的探针或引物。寡核苷酸3′末端越不稳定,假引发的可能性越低。
12. 如果用3′末端低稳定性的引物,反应的最适退火温度范围会不寻常的宽。这就可以不经过事先的最佳化实验就能在最佳条件下进行反应。
13. 引物的唯一性:为了放大单个的、专一性DNA片段,选用的引物序列就应当是唯一的,即在模板中没有重复序列。如果用哺乳动物基因组序列作为模板,可以用Alu序列或其他短重复元件来核对想用的引物的互补性。由此也可知,应当避免使用同寡聚物(如-AAAAAA-)和二核苷酸重复(如-ATATAT-)。
14. 引物和产物的Tm值不要相差太大,20摄氏度范围内较好。定下引物的Tm值范围之后即可定下引物的长度范围。
15. 对引物的修饰一般是增加酶切位点,应参考载体的限制酶识别序列确定,常常对上下游引物修饰的序列选用不同限制酶的识别序列,以有利于以后的工作。
16. 值得一提的是,各种模板的引物设计难度不一。有的模板本身条件较差,比如GC含量偏高或偏低,导致找不到各种指标都十分合适的引物;有时PCR产物要作为克隆对象插入到载体中表达,因此PCR引物设计的可选择度很低。遇到这种情况只能退而求其次,尽量去满足条件,这时,使用自动搜索引物及正确地评价引物可使研究人员对实验心中有数。
17. 在设计克隆PCR引物时,引物两端一般都添加酶切点,必然存在发夹结构,而且能值不会太低,这种PCR需要灵活调控退火温度以达到最好效果,对引物的发夹结构的检测就不应要求太高。
18. 如扩增出多条带(引发错配所致),不出目的带或出目的带很弱(引物引发效率低下)
设计引物都是在已知模板序列的情况下进行。
设计的目的是在两个目标间取得平衡:扩增特异性和扩增效率。引物分析软件将试图通过使用每一引物设计变化的预定值在这两个目标间取得平衡。设计引用有一些需要注意的基本原理:
① 引物长度
一般引物长度为18~30碱基。总的说来,决定引物退火温度(Tm值)最重要的因素就是引物的长度。有以下公式可以用于粗略计算引物的退火温度。
在引物长度小于20bp时:[4(G+C)+2(A+T)]-5℃
在引物长度大于20bp时:62.3℃+0.41℃(%G-C)-500/length-5℃
另外有许多软件也可以对退火温度进行计算,其计算原理会各有不同,因此有时计算出的数值可能会有少量差距。为了优化PCR反应,使用确保退火温度不低于54℃的最短的引物可获得最好的效率和特异性。
PCR引物设计之个人心得篇
总的说来,每增加一个核苷酸引物特异性提高4倍,这样,大多数应用的最短引物长度为18个核苷酸。引物长度的上限并不很重要,主要与反应效率有关。由于熵的原因,引物越长,它退火结合到靶DNA上形成供DNA聚合酶结合的稳定双链模板的速率越小。
② GC含量
一般引物序列中G+C含量一般为40%~60%,一对引物的GC含量和Tm值应该协调。若是引物存在严重的GC倾向或AT倾向则可以在引物5’端加适量的A、T或G、C尾巴。
③ 退火温度
退火温度需要比解链温度低5℃,如果引物碱基数较少,可以适当提高退火温度,这样可以使PCR的特异性增加;如果碱基数较多,那么可以适当减低退火温度,是DNA双链结合。一对引物的退火温度相差4℃~6℃不会影响PCR的产率,但是理想情况下一对引物的退火温度是一样的,可以在55℃~75℃间变化。
④ 避免扩增模板的二级结构区域
选择扩增片段时最好避开模板的二级结构区域。用有关计算机软件可以预测估计目的片段的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能(△G)小于58.6lkJ/mol时,扩增往往不能成功。若不能避开这一区域时,用7-deaza-2’-脱氧GTP取代dGTP对扩增的成功是有帮助的。
⑤ 与靶DNA的错配
当被扩增的靶DNA序列较大的时候,一个引物就有可能与靶DNA的多个地方结合,造成结果中有多个条带出现。这个时候有必要先使用BLAST软件进行检测,网址:
http://www.ncbi.nlm.nih.gov/BLAST/。选择Align two sequences (bl2seq),如下图。
BLAST的使用方法也十分简单,如下图所示。
将引物序列粘贴到1区,将靶DNA序列粘贴到2区,这两者可以互换的,并且BLAST会计算互补、反义链等多种可能,所以不需要用户注意两条链是否都是有义链。如果知道序列在数据库中的GI号也可以直接输入GI号,这样就不用粘贴一大段的序列了。最后在3处点击Align就可以查看引物在靶DNA中是否有多个同源位点了。
可是使用BLAST还是有其不方便的地方。因为它一次只能比较两条序列,那么一对引物就需要分开进行比对。如果存在错配,还需要自己计算由于错配形成的片段长度有多大。在下一篇中将介绍一个软件,可以直接将靶DNA和引物输入对产物片段进行预测。
⑥ 引物末端
引物3’端是延伸开始的地方,因此要防止错配就从这里开始。3’端不应超过3个连续的G或C,因这样会使引物在G+C富集序列区错误引发。3′端也不能有形成任何二级结构可能,除在特殊的PCR(AS-PCR)反应中,引物3′端不能发生错配。如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增特异性与效率。
⑦ 引物的二级结构
引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构,这种二级结构会因空间位阻而影响引物与模板的复性结合。若用人工判断,引物自身连续互补碱基不能大于3bp。两引物之间不应该存在互补性,尤应避免3′端的互补重叠以防引物二聚体的形成。一般情况下,一对引物间不应多于4个连续碱基的同源性或互补性。
⑧ 为了下一步操作而产生的不完全匹配
5’端对扩增特异性影响不大,因此,可以被修饰而不影响扩增的特异性。引物5′端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合DNA序列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。额外的碱基或多或少会影响扩增的效率,还加大引物二聚体形成的几率,但是为了下一步的操作就要作出适当的“牺牲”。
很多时候PCR只是初步克隆,之后我们还需要将目的片段亚克隆到各种载体上,那么就需要在PCR这个步骤为下一步的操作设计额外的碱基。以下总结一些为了亚克隆所要设计的序列。
a 添加限制性内切酶酶切位点
添加酶切位点是将PCR产物进行亚克隆使用得最多的手段。一般酶切位点是六个碱基,另外在酶切位点的5’端还需要加2~3个保护碱基。但是不同的酶需要的保护碱基数目是不相同的,例如:SalⅠ不需要保护碱基,EcoRⅤ需要1个,NotⅠ需要2个,Hind Ⅲ 3个。其中,在原核表达设计引物时还有一些小技巧,大家可以参考:《原核表达之实验前的分析》。里面一些规则是所有表达都通用的。
有一种做法是在进行PCR反应的同时进行酶切,这样就需要注意一些内切酶在PCR反应中的酶切反应率,见附录。不过这种方法虽然方便但并不推荐。有时候,就是把PCR产物回收后酶切再与载体连接效果都不尽理想,同步进行会使出现问题的原因变得更加复杂。一旦出现问题,分析起来更麻烦。
b LIC添加尾巴
LIC的全称是Ligation-Independent cloning,它是Navogen公司专门为其部分的pET载体而发明的一种克隆方法。用LIC 法制备的pET 载体有不互补的12–15 碱基单链粘端,与目的插入片段上相应粘端互补。扩增目的插入片段的引物5'序列要与LIC载体互补。T4 DNA 聚合酶的3'→5'外切活性经短时间即可在插入片段上形成单链粘端。由于只能由制备好的插入片段和载体互相退火形成产物,这种方法非常快速高效,而且为定向克隆。
c 定向TA克隆添加尾巴
在T载体刚出的时候大家都拍手称赞,真是方便,哪个小子脑子这么聪明想出来的。但是后来人们发现TA克隆无法将片段定向克隆到载体中,所以后来Invitrogen推出了可以定向克隆的载体,它的一端含有四个突出的碱基GTGG。因此在PCR引物设计时也要相应的加上与之互补的序列,这样片段就可以“有方向”了。
d In-Fusion克隆方法
这项技术是Clontech还属于BD的时候推出的,2004年在生物通可着实风光了一把,不但当选年度创新试剂还被大家投票为最受大家欢迎的试剂。此技术就其步骤来说是及其方便的,不需连接酶,不需长时间的反应。只要在设计引物的时候引入一段线性化载体两端的
序列,然后将PCR产物和线性化的载体加入到含有BSA的In-Fusion酶溶液中,在室温下放置半个小时就可以进行转化了。这种方法特别适合大批量的转化。
这里顺便提一下如果有什么技术给大家留下深刻影响,欢迎大家发email推荐给生物通。说不定你的推荐可以让它成为年度之星呢。
如果要加入额外的碱基总是或多或少会影响到整个PCR反应,比如在加入NotⅠ的酶切位点后整个引物的退火温度就会直线上升(它识别的是8个碱基,且全为GC),这样使另外一个引物的设计变得十分困难,因为一对引物间退火温度相差不宜太远。因此上面提到许多设计原则在实际应用中往往难以做到都符合。在碰到这些情况的时候,我们只能秉着“实践是检验真理的唯一标准”这一原则,要试一试才能知道能否行得通了。
PCR引物设计原则设计的目的是在两个目标间取得平衡:扩增特异性和扩增效率。引物分析软件将试图通过使用每一引物设计变化的预定值在这两个目标间取得平衡。设计引用有一些需要注意的基本原理:① 引物长度一般引物长度为18~30碱基。总的说来,决定引物退火温度(Tm值)最重要的因素就是引物的长度。有以下公式可以用于粗略计算引物的退火温度。在引物长度小于20bp时:[4(G+C)+2(A+T)]-5℃在引物长度大于20bp时:
62.3℃+0.41℃(%G-C)-500/length-5℃另外有许多软件也可以对退火温度进行计算,其计算原理会各有不同,因此有时计算出的数值可能会有少量差距。为了优化PCR反应,使用确保退火温度不低于54℃的最短的引物可获得最好的效率和特异性。总的说来,每增加一个核苷酸引物特异性提高4倍,这样,大多数应用的最短引物长度为18个核苷酸。引物长度的上限并不很重要,主要与反应效率有关。由于熵的原因,引物越长,它退火结合到靶DNA上形成供DNA聚合酶结合的稳定双链模板的速率越小。② GC含量一般引物序列中G+C含量一般为40%~60%,一对引物的GC含量和Tm值应该协调。若是引物存在严重的GC倾向或AT倾向则可以在引物5’端加适量的A、T或G、C尾巴。③ 退火温度退火温度需要比解链温度低5℃,如果引物碱基数较少,可以适当提高退火温度,这样可以使PCR的特异性增加;如果碱基数较多,那么可以适当减低退火温度,是DNA双链结合。一对引物的退火温度相差4℃~6℃不会影响PCR的产率,但是理想情况下一对引物的退火温度是一样的,可以在55℃~75℃间变化。④ 避免扩增模板的二级结构区域选择扩增片段时最好避开模板的二级结构区域。用有关计算机软件可以预测估计目的片段的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能(△G)小于58.6lkJ/mol时,扩增往往不能成功。若不能避开这一区域时,用7-deaza-2’-脱氧GTP取代dGTP对扩增的成功是有帮助的。⑤ 与靶DNA的错配当被扩增的靶DNA序列较大的时候,一个引物就有可能与靶DNA的多个地方结合,造成结果中有多个条带出现。这个时候有必要先使用BLAST软件进行检测,网址:
http://www.ncbi.nlm.nih.gov/BLAST/。选择Align two sequences (bl2seq),如下图。BLAST的使用方法也十分简单,如下图所示。将引物序列粘贴到1区,将靶DNA序列粘贴到2区,这两者可以互换的,并且BLAST会计算互补、反义链等多种可能,所以不需要用户注意两条链是否都是有义链。如果知道序列在数据库中的GI号也可以直接输入GI号,这样就不用粘贴一大段的序列了。最后在3处点击Align就可以查看引物在靶DNA中是否有多个同源位点了。可是使用BLAST还是有其不方便的地方。因为它一次只能比较两条序列,那么一对引物就需要分开进行比对。如果存在错配,还需要自己计算由于错配形成的片段长度有多大。在下一篇中将介绍一个软件,可以直接将靶DNA和引物输入对产物片段进行预测。⑥ 引物末端引物3’端是延伸开始的地方,因此要防止错配就从这里开始。3’端不应超过3个连续的G或C,因这样会使引物在G+C富集序列区错误引发。3′端也不能有形成任何二级结构可能,除在特殊的PCR(AS-PCR)反应中,引物3′端不能发生错配。如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增特异性与效率。⑦ 引物的二级结构引物自身不应存在互补序列,否则引物自身会折叠成发夹状结
构,这种二级结构会因空间位阻而影响引物与模板的复性结合。若用人工判断,引物自身连续互补碱基不能大于3bp。两引物之间不应该存在互补性,尤应避免3′端的互补重叠以防引物二聚体的形成。一般情况下,一对引物间不应多于4个连续碱基的同源性或互补性。⑧ 为了下一步操作而产生的不完全匹配5’端对扩增特异性影响不大,因此,可以被修饰而不影响扩增的特异性。引物5′端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合DNA序列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。额外的碱基或多或少会影响扩增的效率,还加大引物二聚体形成的几率,但是为了下一步的操作就要作出适当的“牺牲”。很多时候PCR只是初步克隆,之后我们还需要将目的片段亚克隆到各种载体上,那么就需要在PCR这个步骤为下一步的操作设计额外的碱基。以下总结一些为了亚克隆所要设计的序列。a 添加限制性内切酶酶切位点添加酶切位点是将PCR产物进行亚克隆使用得最多的手段。一般酶切位点是六个碱基,另外在酶切位点的5’端还需要加2~3个保护碱基。但是不同的酶需要的保护碱基数目是不相同的,例如:SalⅠ不需要保护碱基,EcoRⅤ需要1个,NotⅠ需要2个,Hind Ⅲ 3个。其中,在原核表达设计引物时还有一些小技巧,大家可以参考:《原核表达之实验前的分析》。里面一些规则是所有表达都通用的。有一种做法是在进行PCR反应的同时进行酶切,这样就需要注意一些内切酶在PCR反应中的酶切反应率,见附录。不过这种方法虽然方便但并不推荐。有时候,就是把PCR产物回收后酶切再与载体连接效果都不尽理想,同步进行会使出现问题的原因变得更加复杂。一旦出现问题,分析起来更麻烦。b LIC添加尾巴LIC的全称是Ligation-Independent cloning,它是Navogen公司专门为其部分的pET载体而发明的一种克隆方法。用LIC 法制备的pET 载体有不互补的12–15 碱基单链粘端,与目的插入片段上相应粘端互补。扩增目的插入片段的引物5'序列要与LIC载体互补。T4 DNA 聚合酶的3'→5'外切活性经短时间即可在插入片段上形成单链粘端。由于只能由制备好的插入片段和载体互相退火形成产物,这种方法非常快速高效,而且为定向克隆。c 定向TA克隆添加尾巴在T载体刚出的时候大家都拍手称赞,真是方便,哪个小子脑子这么聪明想出来的。但是后来人们发现TA克隆无法将片段定向克隆到载体中,所以后来Invitrogen推出了可以定向克隆的载体,它的一端含有四个突出的碱基GTGG。因此在PCR引物设计时也要相应的加上与之互补的序列,这样片段就可以“有方向”了。d In-Fusion克隆方法这项技术是Clontech还属于BD的时候推出的。此技术就其步骤来说是及其方便的,不需连接酶,不需长时间的反应。只要在设计引物的时候引入一段线性化载体两端的序列,然后将PCR产物和线性化的载体加入到含有BSA的In-Fusion酶溶液中,在室温下放置半个小时就可以进行转化了。这种方法特别适合大批量的转化。如果要加入额外的碱基总是或多或少会影响到整个PCR反应,比如在加入NotⅠ的酶切位点后整个引物的退火温度就会直线上升(它识别的是8个碱基,且全为GC),这样使另外一个引物的设计变得十分困难,因为一对引物间退火温度相差不宜太远。因此上面提到许多设计原则在实际应用中往往难以做到都符合。在碰到这些情况的时候,我们只能秉着“实践是检验真理的唯一标准”这一原则,要试一试才能知道能否行得通了本文引自生物秀论坛:http://bbs.bbioo.com/thread-23522-1-1.html
PCR引物设计的目的是为了找到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。因此,引物的优劣直接关系到PCR的特异性与成功与否。 1、要设计引物首先要找到DNA序列的保守区;同时应预测将要扩增的片段单链是否形成二级结构,如这个区域单链能形成二级结构,就要避开它,如这一段不能形成二级结构,那就可以在这一区域设计引物;引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构造成引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。若用人工判断,引物自身连续互补碱基不能大于3bp。2、一般引物长度为15~30碱基,扩增片段长度一般为100~600碱基对,不同应用可设计不同长度选择不同性能的taq。3、一般引物序列中G+C含量一般为40%~60%。
而且四种碱基的分布最好随机。不要有聚嘌呤或聚嘧啶存在。否则引物设计的就不合理。应重新寻找区域设计引物。其Tm值是寡核苷酸的解链温度,即在一定盐浓度条件下,50%寡核苷酸双链解链的温度,有效启动温度,一般高于Tm值5~10℃。若按公式Tm=4(G+C)+2(A+T)估计引物的Tm值,则有效引物的Tm为55~80℃,其Tm值最好接近72℃以使复性条件最佳。
4、同时引物之间也不能有互补性,尤应避免3′端的互补重叠以防引物二聚体的形成,一般体系中引物间不应多于4个连续碱基的互补。5、引物与非特异扩增序列的同源性不要超过70%或有连续8个互补碱基同源。6、引物确定以后,可以对引物进行必要的修饰,例如可以在引物的5′端加酶切位点序列;标记生物素、荧光素、地高辛等,这对扩增的特异性影响不大。但3′端绝对不能进行任何修饰,因为引物的延伸是从3′端开始的。这里还需提醒的是3′端不要终止于密码子的第3位,因为密码子第3位易发生简并,会影响扩增的特异性与效率。
引物设计的原则:
首先引物要跟模板紧密结合,其次引物与引物之间不能有稳定的二聚体或发夹结构存在,再次引物不能在别的非目的位点引起DNA聚合反应(即错配)。围绕这几条基本原则,设计引物需要考虑诸多因素,如引物长度(primer length)、产物长度(product length)、序列Tm值(melting temperature)、ΔG值(internal stability)、引物二聚体及发夹结构(duplex formation and hairpin)、错误引发位点(false priming site)、引物及产物GC 含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。以使用Oligo 软件分析设计引物为例,总结出以下的要点:
1. 引物的长度一般为15-30bp,常用的是18-27bp,但不能大于38,因为过长会导致其延伸温度大于74℃,即Taq 酶的最适温度。
2. 引物3’端的序列要比5’端重要。引物3’端的碱基一般不用A(3’端碱基序列最好是G、C、CG、GC),因为A在错误引发位点的引发效率相对比较高。另外引物间3’端的互补、二聚体或发夹结构也可能导致PCR反应失败。5’端序列对PCR 影响不大,因此常用来引进修饰位点或标记物。
3. 引物的GC含量一般为40-60%,以45-55%为宜,过高或过低都不利于引发反应。有一些模板本身的GC 含量偏低或偏高,导致引物的GC含量不能在上述范围内,这时应尽量使上下游引物的GC 含量以及Tm 值保持接近(上下游引物的GC含量不能相差太大),以有利于退火温度的选择。如果G-C比例超出,则在引物的5’端增加As或Ts;而如果A-T比例过高,则同样在5’端增加Gs或Cs。但也有认为:原来普遍认为PCR引物应当有50%的GC/AT比率的观点其实是不对的,以人基因组DNA为模板,用81%AT的引物可以产生单一的、专一的、长250 bp,含有70% AT的产物。完全没有必要复杂地去计算产物和引物的解链温度,PCR引物的GC/AT比率应当等于或高于所要放大的模板的GC/AT比。
4. 引物所对应模板序列的Tm 值最好在72℃左右。(Tm 值曲线以选取72 度附近为佳,5’到3’的下降形状也有利于引物引发聚合反应),至少要在55-80℃之间。
5. ΔG值(自由能)反映了引物与模板结合的强弱程度。一般情况下,引物的ΔG值最好呈正弦曲线形状,即5’端和中间ΔG值较高,而3’端ΔG值相对较低,且不要超过9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。3′末端双链的ΔG是0~-2 kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%、到-8时少于20%、而-10时接近于0。
6. 可能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错误引发率高,错误引发的引发率一般不要高过100,如此可保证不出非目的产物的假带。但对于特定的模板序列,还应结合比较其在正确位点的引发效率。如果两者相差很大,比如在
正确位点的引发效率为450 以上,而在错误位点的引发效率为130,并且不好找其他更合适的引物,那么这对引物也是可以接受的。
7. Frq 曲线为Oligo6新引进的一个指标,揭示了序列片断存在的重复机率大小。选取引物时,宜选用Frq 值相对较低的片断。
8.引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带而且会降低引物浓度从而导致PCR 正常反应不能进行,与二聚体相关的一个参数是碱基的分布,3’端的连续GGG 或CCC 会导致错误引发。二聚体形成的能值越高越稳定,越不符合要求。与二聚体相同,发夹结构的能值越低越好。虽然有些带有发夹环,其ΔG为-3 kcal/mol的自身互补引物也可以得到不错的结果,但是如果它的3′末端被发夹环占据时就很麻烦,即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。当然,如果发夹环在5′末端对反应就没有多大的影响了。
9. 以公式(4×G/C + 2×A/T–5)计算Tm值,即退火温度。选择较低Tm值的引物的退火温度为反应的退火温度。4-6℃的差别似乎对PCR产量影响不大。最好,保证每个引物的Tm值相匹配,且在70-75℃范围内。
10. 要知道,更重要的因素是模板与稳定性较小的引物之间解链温度的差异。差异越小,PCR的效率越高。因为DNA的解链温度也取决于它的长度,所以有的研究者喜欢设计很长,而不求它很稳定的引物。可是,引物太长就难以避免形成二聚体和自身互补,因此,一般还是不用为好。如果期待的产物长度等于或小于500 bp,选用短的(16~18 mer)的引物:若产物长5 kb,则用24 mer的引物。有人用20~23 mer引物得到40 kb的产物。
11. 在DNA测序和PCR中最好用5′末端稳定(如GC含量较多),而3′末端不太稳定(如AT含量较多)的引物,这种引物的结构可以有效地消除假引发反应。这就是基于引物内部稳定性的经验之谈。其3′末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在3′末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发DNA合成,所以不会产生假产物。因此,为了有效地引发反应,引物的5′末端和中央部分必须与靶DNA也形成双链。与此相反,带有稳定的、GC丰富的3′末端的寡核苷酸不需要其所有的核苷酸序列都与靶序列配对,只凭借其3′末端与靶序列任何位点的牢固配合就可以引发反应,产生非专一产物。无论如何,寡核苷酸3′末端最后5个核苷酸的稳定性小于-9 kcal/mol的,通常就是专一性的探针或引物。寡核苷酸3′末端越不稳定,假引发的可能性越低。
12. 如果用3′末端低稳定性的引物,反应的最适退火温度范围会不寻常的宽。这就可以不经过事先的最佳化实验就能在最佳条件下进行反应。
13.引物的唯一性:为了放大单个的、专一性DNA片段,选用的引物序列就应当是唯一的,即在模板中没有重复序列。如果用哺乳动物基因组序列作为模板,可以用Alu序列或其他短重复元件来核对想用的引物的互补性。由此也可知,应当避免使用同寡聚物(如—AAAAAA—)和二核苷酸重复(如—ATATAT—)。
14. 引物和产物的Tm值不要相差太大,20摄氏度范围内较好。定下引物的Tm值范围之后即可定下引物的长度范围。
15. 对引物的修饰一般是增加酶切位点,应参考载体的限制酶识别序列确定,常常对上下游引物修饰的序列选用不同限制酶的识别序列,以有利于以后的工作。
16. 值得一提的是,各种模板的引物设计难度不一。有的模板本身条件较差,比如GC含量偏高或偏低,导致找不到各种指标都十分合适的引物;有时PCR产物要作为克隆对象插入到载体中表达,因此PCR引物设计的可选择度很低。遇到这种情况只能退而求其次,尽量去满足条件,这时,使用自动搜索引物及正确地评价引物可使研究人员对实验心中有数。
17.在设计克隆PCR引物时,引物两端一般都添加酶切点,必然存在发夹结构,而且能值不会太低,这种PCR需要灵活调控退火温度以达到最好效果,对引物的发夹结构的检测就不应要求太高。
最佳的PCR条件
PCR反应的特异性在很大程度上是由寡聚核苷酸引物的序列所决定的。对于特定的引物组,PCR的特异性可以由于采用最佳的反应条件、退火温度和PCR缓冲液中的 MgCl2浓度而发生明显的变化。如果用标准的1.5mM的MgCl2浓度不能得到所需的特异性PCR产物,我们建议MgCl2的终浓度为1.4∽2.5mM之间,以0.2mM增长率来改变MgCl2 浓度,以选择最佳Mg++浓度。一个较常遇见的问题是,使PCR特异性达到最高的MgCl2 浓度导致PCR扩增失败(dropouts)。这可能是由于模板DNA溶液中有较高的EDTA,它隆 低了提供给Taq DNA聚合酶MgCl2量。因此,对于扩增溶解在TE(1mM EDTA)中的DNA,我们建议用含2.0mM的MgCl2的PCR缓冲液。
PCR反应的温度范围包含有三个不同的恒定期:变性期、退火期和延伸期,还有它们之间的过渡期。为了获得用于序列分析的模板或杂交探针的单链DNA,通常并不需 要改变参数。
目标产物的长度一般和引物设计关系不大。设计的时候,应注意如下要点:
1. 引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于Taq DNA聚合酶进行反应[2]。
2. 引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增加[2]。
3. 引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应当避免在引物的3’端使用碱基A[3][4]。另外,引物二聚体或发夹结构也可能导致PCR反应失败。5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物[2]。
4. 引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大[2][5]。
5. 引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。Tm值的计算有多种方法,如按公式Tm=4(G+C)+2(A+T),在Oligo软件中使用的是最邻近法(the nearest neighbor method) [6][7]。
6. ΔG值是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。应当选用3’端ΔG值较低(绝对值不超过9),而5’端和中间ΔG值相对较高的引物。引物的3’端的ΔG值过高,容易在错配位点形成双链结构并引发DNA聚合反应[6]。
7. 引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行[8]。
8. 对引物的修饰一般是在5’端增加酶切位点,应根据下一步实验中要插入PCR产物的载体的相应序列而确定。
值得一提的是,各种模板的引物设计难度不一。有的模板本身条件比较困难,例如GC含量偏高或偏低,导致找不到各种指标都十分合适的引物;在用作克隆目的的PCR因为产物序列相对固定,引物设计的选择自由度较低。在这种情况只能退而求其次,尽量去满足条件。