分子标记技术的进展及其应用
吴谡琦等:分子标记技术的进展及其应用
分子标记技术的进展及其应用
吴谡琦② 张进兴 洪旭光 孙修勤③
(国家海洋局第一海洋研究所 青岛266061)
①
提 要 综述了分子标记产生与发展的过程,综合比较、分析了目前常用的RAPD、DAF、SSCP、AFLP、VNTR、RFLP、同工酶等分子标记技术的原理、特点和适用范围,简要介绍
了分子标记技术的研究与开发现状以及未来的发展趋势。
分子标记技术本质上都是以检测生物个体在基
因或基因型上所产生的变异来反映基因组之间差异。每一种分子标记都有其自身的特点和特定的应用范围,但以一般性的意义而论,判断一种分子标记优劣的依据应当包括以下几方面的内容(如表1所列):
PCR分析 利用PCR技术的忠实性、效率和特异性可以极大地简化样品的收集与处理工作,同时也降低了对样品数量和质量的要求,通常几十纳克(ng)以内的DNA样品就足以应付分析的需要,这对于分子标记辅助育种、QTL定位等研究带来了很大的便利。此外,PCR还可以锁定特定的目标DNA区域进行扩增,有利于后续工作的开展(序列测定、功能研究等)。但是,同时也必须注意不严格的PCR条件的准确度(如RAPD)。
单位点标记 理想的分子标记应当既具有单位点分析的精确性又具有多位点分析的效率和便利,单位点与多位点分析技术到目前为止还是难以协调一致的。多位点分析(RAPD、DAF等)在技术上相当简单而高效,但存在显著的缺陷和局限性。如显性遗传方式无法准确估计等位基因频率、杂和度等,在分子进化、种群遗传等结果准确性要求比较严格的应用受到严重制约。而单位点标记(SSR、RFLP等)虽然分析结果可靠但工作效率却较低,不可能在大规模的遗传分析中广泛应用。
共显性表达 分子标记最重要的属性之一。只有共显性表达方式的分子标记才能进行各项精确的遗传分析并满足各个领域研究发展的需要。数据的连续性/通用性 涉及分子标记技术的精确度和重复性。在许多研究领域,包括QTL定位、系统演化、分子进化等等,都需要往往是一个实
0 引言
遗传与变异是生物进化的基础,也是生物学研
究的核心问题。分子标记是以蛋白质、核酸分子的突变为基础,检测生物遗传结构与其变异的一种有力工具。在分子标记技术诞生以前,宏突变(macro2mutation)由于具有显著的表型效应,是用于观察、研究生物遗传变异及其规律的最重要的手段。但是,尽管某些宏突变生物个体在实验室中比较易于得到,自然界中却非常罕见,其原因是宏突变对于生物个体而言绝大多数都是有害的,因而会为自然选择所淘汰[1]。这极大地限制了人们对生物进化的过程和内因的深刻认识。虽然自然界里宏突变产生的几率是相当低的,但这绝不意味着生物群体不存在大量的变异,实际上,最为常见的变异就是由多基因(polygenes)控制的、呈连续分布的表型变异。随着当代生物技术水平的提高,更深层次的遗传变异被大量地揭示,使人们对生物进化的认识产生了质的飞跃。这一跨越就是依赖直接检测蛋白质乃至DNA分子水平遗传变异的分子标记技术的发展而实现的。
以20世纪50年代同工酶的发现为开端[2],伴随着生命科学领域理论与技术所取得的重大突破,尤其是DNA双螺旋结构的阐明、PCR技术的诞生,
使分子标记技术从蛋白质、酶向
DNA分子水平逐步深化,至今已衍生出不下几十种、用于不同研
究目的的分子标记。表1列出了目前常见的几种分子标记和它们各自的特点[3-11]。
①973计划(G1999012008)和国家海洋局青年基金资助项目。②男,1969年生,博士;研究方向:分子遗传学。③联系人。
(收稿日期:2000204201)
—99
—
验室无力而且也不可能独自承担的大量的分子标记用于研究,良好的数据连续性/通用性是保证分子标记有效应用的前提。
变异检测范围与分辨力:一个好的分子标记能够检测的变异数目应当是无限制的,也就是同时拥有良好的分辨力,这样才能客观地反映生物实际的变异水平,不至于把目的DNA掩盖起来。
其它需要考虑的因素诸如一次可检测的位点数、技术复杂程度与易用性等的对分子标记的影响
是容易理解的,在此不再赘述。
由于现有的分子标记没有一种能够取得全面的、理想的效果,因此,针对需要解决的问题选择合适的分子标记技术意义十分重大,对研究结果的产生、分析和应用有着决定性的影响。以下就各种常用分子标记技术的原理、技术本身的优缺点与应用范围作一简要介绍,以期为相关领域的工作开展提供参考。
表1 常用的分子标记及其主要特征
标记类型
线粒体、叶绿体标记
DNA序列RFLP
核基因组多位点标记SSR/VNTRRAPDAFLPDAF
核基因组单位点标记同工酶(等位酶)SSRVNTR
DGGE/TGGESSCPPCR
单位点分析
共显性是是否否否否是是是是是家系鉴定准确准确否否否否否否否否否一次可检测的位点数少(1)少(1)许多许多许多许多中等许多中等少(1)少(1)数据的连续性/通用性
好好一般一般较好一般好较好较好好好变异检测范围低2高低2中等高高高高
分辨力高高高高高高
技术复杂程度
较复杂复杂复杂简单较简单较简单简单复杂复杂较复杂较简单是否否是是是否是极少是是是是否否否否是是是是是低2中等低2中等高高高高低2中等高低2中等高 注:缩写及表格内容详见正文。
1 分子标记技术的原理及其应用
111 RAPD/DAF(DNA随机扩增多态性/扩增指纹
图谱)
几乎所有基于PCR扩增对任意未知基因组DNA模板序列的多态性进行检测的分子标记技术都是建立在合成的随机寡聚核苷酸引物所产生的特征性指纹图谱基础上的。用较短的引物(一般为10bp左右)扩增基因组DNA通常都能够得到随机分布在整个基因组上的多重扩增产物。这一现象使三种分子标记技术得以建立:RAPD[7]、AP2PCR[8]以及DAF[9]。它们所依据的原理是基本一致的,即模板DNA在94℃变性解链后,在较低的退火温度
)引物与模板DNA互补形成双链结构,下(如37℃
如果基因组DNA两个位点间为可扩增的距离(约200~4000bp),同时引物以3’末端相对的方式分别位于两条互补链上,即可通过延伸、循环得到一个扩增产物。这个扩增产物在通常情况下可被视为基因组上的一个位点。就某一特定引物而言,它与基因组结合位点的序列互补,决定了扩增产物也是具有—100
—
一定特异性的,如果不同个体在结合位点上的序列因突变存在差异,或者两个结合位点间由于DNA序列的插入、缺失造成距离变化,就会形成扩增产物的出现/消失或长度变异等多态现象,从而成为指示基因组DNA多态的分子标记。由于一个随机引物在基因组DNA上与其互补序列相结合的位点是有限的,不可能反映出总体的变异状况,通过使用大量不同的随机引物,就可得到许多的扩增产物(位点),使检测范围涵盖整个基因组,从而形成生物的特征性指纹图谱。
可以看出,上述分子标记技术由于使用的是随机引物,因此一方面免除了其他如微卫星标记引物设计的繁琐、复杂,另一方面又不存在种属特异性,同样的引物可应用于任何一种未知基因组中去,因而在DNA分子多态的检测中得到广泛的应用,如DNA、RNA指纹图谱、遗传连锁图谱的构建,分子标记辅助育种,系统发育与分子进化,种群生物学,以及疾病检测等许多方面[9]。
虽然RAPD等分子标记技术有其独特的优势,但在实际应用中也必须注意到他们固有的缺陷。短
的引物序列只能通过较低的退火温度寻求较高的结合几率,这样做虽然提高了扩增产物的数量,使其一次检测的“位点”可以达到几十甚至数百个,但这种方式是以降低PCR反应的忠实性为代价的,它可使误配的几率大大增加,检测到的变异实际是非遗传的或根本不是目标生物的,有时假阳性的比例甚至可以达到60%[12]。另一个根本性的限制因素是显性表达机制,只能用电泳条带的有无而不是等位基因识别多态,无法区分杂合子,对于结果准确性要求比较高的研究,还需要通过Southern转移来加以验证,因此在应用于亲缘关系很近(种属以下)的物种/同种种群中才有较高的可信度。112 RFLP(限制性酶切片段长度多态性)
RFLP是较早产生的基于DNA多态的分子标记技术。它所检测的DNA分子多态来源于:(1)突变形成的、决定限切片段数量的限制性内切酶酶切位点位点的存在与否,(2)两个限切位点间因DNA插入、重排或缺失造成的长度变异。经典的RFLP标记是模板DNA经过限制性内切酶消化、电泳分离、Southern转移后,再用DNA探针进行杂交后得到的,整个的处理过程比较冗长,步骤繁琐,有一定的技术难度,因此在应用中尤其是需要大量分子标记的研究中受到限制。但是,由于RFLP标记具有很高的分辨力,又以共显性的方式遗传,其结果有着很强的重复性和准确度,在高密度遗传连锁图谱、指纹图谱的构建、群体遗传与系统演化等研究领域仍然具有重要的应用价值[3]。113 AFLP(扩增片断长度多态性)
AFLP是近年来迅速发展起来的一种分子标记
AFLP集RFLP与RAPD两种分子标记技术的
优势于一体。由于使用了具有特异识别位点的限制
性内切酶消化模板DNA,以及在3’末端加入了选择性核苷酸的半特异性引物,尽管同样是一种核基因组多位点分析的分子标记技术,它避免了RAPD分子标记重复性差、假阳性反应过高等不利因素的影响,同时,它又无需任何目的基因组DNA的背景资料即可完成模板DNA多态的检测,摆脱了RFLP繁琐的转膜、克隆、探针制备、分子杂交等一系列繁重而且有一定难度的工作。因此,高分辨力、准确性和重复性使AFLP目前已成为制作高密度连锁图谱、分子标记辅助育种、遗传多样性检测、系统分类、QTL定位、基因定位等的主要分子标记。当然,AFLP也同样存在一些技术上的不足,它所得到的主要是显性(约占多态位点数的85%~96%)而非共显性标记[4],制约了在相关领域的应用。114 SSR/VNTR(简单序列重复或微卫星/数量可变串联重复或小卫星)
SSR和VNTR是两类在基因组中大量存在的
基因外的重复序列,其中SSR指由2~6个碱基组成的核心序列多次串联重复而成。VNTR一般指核心序列较长,由十几到几十个碱基组成的串联重复序列。由于这些重复序列的突变率很高(10-5~10-3),导致核心序列的的数目产生增减变化,在不同的个体间表现为DNA片段长度高度可变,因而成为极其丰富的限制性长度多态标记[11,13]。基因组DNA经过酶切、Southern转移后,用微卫星作为探针即可得到具有高度个体特异性的指纹图谱。由于微卫星序列在整个基因组中都有分布,产生的是稳定遗传的共显性标记,而且体细胞和生殖细胞在微卫星指纹图谱上完全一致,因此,尽管微卫星探针具有高度的种属特异性,使得探针的制备以及对未知基因组微卫星指纹图谱的构建具有相当的难度,需要投入大量的人力、物力等种种因素的限制,上述的巨大优势仍然使SSR/VNTR标记在医学、生命科学的相关领域高精度的分析中具有无可替代的价值,例如,利用SSR高度特异、高密度的指纹图谱,已经成功地获得了对虾抗病基因的分子标记,具有该标记的对下成活率显著提高,达到90%以上(对照组的成活率仅为5%)。115 SSCP/SNP(单链构向多态性/单核苷酸多态性)
与蛋白质一样,单链DNA的二级结构由碱基组成所决定。在非变性聚丙烯酰胺凝胶电泳中,由
—101
—
技术,最初被称为SRFA(SelectiveRestrictionFrag2mentAmplification,限制性片断选择扩增)[14],它将基因组DNA用成对的限制性内切酶双酶切后产生的片段用接头(与酶切位点互补)连接起来,并通过5’端与接头互补的半特异性引物扩增得到大量DNA片段从而形成指纹图谱的分子标记技术[6]。它主要通过以下步骤来实现基因组DNA多态性的检测:(1)两个不同的限制性内切酶消化模板DNA(通常采用一个高频的和一个低频的限制性内切酶作为酶切组合);(2)限切片段末端连接到双链接头;(3)用与接头、限切位点序列互补的引物对连接产物进行预扩增;(4)预扩增产物再次用选择性引物扩增并加以标记,最终形成数量非常丰富的DNA扩增片段库(一对引物组合通常能够得到50~100个扩增产物)。
于DNA分子在电泳中的迁移率与其分子量和空间构型有关,不同碱基组成的DNA分子在分子内力的作用下形成不同的空间结构因而得以在电泳中分离,从而能够检测出DNA分子间的差异。SSCP就是依照上述原理对PCR扩增产物中特定的基因组DNA序列变异进行分析的。它是一种共显性标记,
和发现开创了真正意义上分子标记技术的先河[2]。同工酶是一类一级结构不同、理化性质相异,具有种属、发育及组织特异性但催化同一化学反应、功能(近似)相同的酶类。同工酶是基因表达的产物,为遗传所决定的生化性状,在进行遗传分析是具有表达完全、无显隐性之分(共显性表达)、不受外界环境干扰的特点,因此最早成为生物群体结构的遗传标记。由于同工酶易于检测,显隐性完全,在近30年的时间里一直占据着分子标记的主导地位。应用该标记进行研究的生物种类已经超过1200种[20],涉及的领域极广,包括种群遗传、系统分类与进化、生物多样性与种质资源的保护、基因表达与调控等等。
与目前的DNA分子标记相比,同工酶对样品的质量要求比较高,所检测的位点数相对较少,难以全面反映基因组的遗传变异情况。同时,蛋白质电泳(包括淀粉胶、聚丙烯酰胺凝胶电泳)检测变异的分辨力也不够理想,因此在遗传多样性、QTL制图与定位、分子标记辅助育种、分子进化等需要大量标记的研究中逐渐为DNA分子标记所取代。然而,同工酶(蛋白质)分子标记的以下特点:共显性表达、结果准确重复性强、作为基因产物可以在一定程度上反映转录和翻译水平的变异、操作简便等,使其仍然在种群遗传、分子进化、适应的分子基础、功能基因的克隆等方面具有DNA分子标记无可代替的作用[3]。
可用于快速检测点突变,因此在医学中有重要作用[15]。随着人类基因组计划的完成,预计它将被SNPs所取代。
SNPs的含义十分简单,就是指不同个体基因组DNA序列之间单个核苷酸的差异。SNP,至少从理
论上来说,是目前覆盖了基因组所有DNA多态的唯一标记方法。根据人类基因组测序的结果,大约每隔1191kb就会出现一个SNP,在人类总长为3×109的DNA序列中,大约有116×10-6~312×106个SNPs[17]。这还仅仅是两个序列的比较,如果将群体考虑在内,人类SNPs的数量会远远高于此数。另外一个极有意义的发现是,人类几乎每个编码基因都有SNP(称之为cSNPs),意味着每一个基因都以多种等位形式存在,了解cSNPs造成的基因差异将是关注的热点。由于SNPs可以检测出生物基因组序列每一个核苷酸的变异,作为全面检测遗传差异的根本性手段,它将对生命科学、医学起到的作用是无可估量的。仅就目前而言,已经对遗传病基因、分子进化、功能基因组研究等方面的进展产生了重大影响[18,19]。但是,SNPs的技术基础是基因组的全面测序,决定了它只能是测序生物的强有力工具,在当前情况下还不可能大规模的应用到基因组未知的生物中去。116 DGGE/TGGE(变性梯度凝胶电泳/温度梯度凝胶电泳)
DNA双螺旋结构是通过氢键和碱基的疏水作
2 分子标记技术的发展前景
纵观上述各种分子标记技术的发展历史,根据技术的自身特点,笔者预计,将来的分子标记技术将主要向以下两方面发展:(1)提高多位点、大规模检测技术的准确性和重复性;(2)提高单位点标记的易用性和经济性;二者最终将会相互紧密的融合到一起。近期出现的一些新技术如基因芯片已经在这方面展示出良好的发展前景[20]。
就当前的技术现状而言,毫无疑问,建立在DNA变异的基础上的分子标记已成为技术领域的
用维持的。在温度、有机溶剂、pH等因素的影响下,氢键受到破坏使双链解离为单链(变性)。DGGE/TGGE利用上述原理,分别在聚丙烯酰胺凝胶中采用化学变性剂梯度/温度梯度,由于不同碱基组成的DNA片段在不同的梯度范围内产生变性,含有单链片段的DNA迁移率明显下降,因而经电泳可将大小相同而序列不同的DNA片段分离。在变性条件使党的情况下,该技术的分辨力可达一个碱基对,因此在人类遗传性疾病的筛选分析、育种、突变个体的检测、遗传多样性等研究中得到较为广泛的应用。117 同工酶分子标记
同工酶(或称为等位基因酶,Allozyme)的分离—102
—
主流。其中,以AFLP为代表的分子标记技术由于有着良好的重复性、准确性以及,能够建立高质量、高密度的遗传连锁图谱,已经在多位点标记方面替代了RAPD、DAF等早期的标记,对未知基因组生物的研究发挥着重要的作用[4]。另外,随着人类基因组计划的即将完成、数十种模式生物基因组序列的测定,SNPs在一年间数量增长了一千倍[20],它将会在已知基因组序列的研究中得到迅速的发展。同
时,笔者认为,分子标记技术有可能在以下两方面取得重要进展:
以生物信息学为基础的分子标记技术:迄今为止,除了人类基因组以外,已经测定了多种生物的核基因组和细胞质基因组全序列,包括:599种病毒和类病毒、205种质粒、185种细胞器、31种真细菌、7种古细菌、2种动物和一种植物[21]。同时,还有包括5种海洋动物在内的多种生物基因组业已启动[22]。面对如此海量的信息,单纯地依靠生物学手段去读懂基因组信息是不可能的。因此,利用生物信息学研究序列分布的规律,从中探索高效的分子标记技术将是大有可为的。
以蛋白质组学为基础的分子标记技术:蛋白质是基因表达的产物,是基因功能的执行体,同时也是生物各种生理、生化反应的构造者和调解者,决定了生物的生长、发育、繁殖等各种性状。通过蛋白质组的研究,了解生物体蛋白质表达的时空分布规律,以及不同个体/组织间的表达差异,以蛋白质分子标记定位生物的表性变异(如抗病、抗逆等性状)和相关基因,这是DNA分子标记难以实现的。目前常规的蛋白质组分析已经取得了相当高的分辨率,普通的蛋白质2D电泳即可稳定地分离数以千计的蛋白质[23],这已经解决了以往同工酶/蛋白质分子标记检测位点数量太少的瓶颈,因而蛋白质分子标记的发展前景十分广阔。
参考文献:
[1]TanksleySD1Annu1Rev1Genet1,1993,27:205
[2]MarkertCL,MollerF1Proc1Natl1Acad1Sci1
USA1,1959,45:753
[3]SunnucksP1TrendsEcol1Evol.,2000,15:199
[4]MuellerUG,WolfenbargerLL1TrendsEcol1Evol1,
1999,14:389
[5]AviseJC1MolecularMarkers,NaturalHistoryandEvolu2
tion1Chapman&Hall,1994
[6]VosP,HogersR,BleekerM,etal1NucleicAcidsRes1,
1995,23:4407
[7]WilliamsJG,KubelicAR,LivakKJ,etal1Nucleic
AcidsRes1,1990,18:6531
[8]WelshJ,PetersenC,McClellandM1NucleicAcidsRes1,
1991,19:303
[9]Caetano2AnollesG1PCRMethodsApplications,1993,
(3):85
[10]AkkayaMS,BhagwatAA,CregenPB1Genet1,
1992,132:1131
[11]JeffreysAJ1Nature,1985,316:76
[12]PerezT,AlbornozJ,DominguezA1Mol1Ecol1,1998,
(7):1347
[13]JeffreysAJ,McleodA,TamakiA,etal1Nature,
1991,354:204
[14]ZabeauM,VosP1Publication0534858A11European
PatentOffice,Munich,Germany,1993
[15]OritaM,SuukiT,HayashiK1Genomics,1989,5:874[16]StonekingM1Nature12001,409:821
[17]WangDG,FanJB,SiaoCJ,etal1Science,1998,
280:1077
[18]ChakravartiA1Nature12001,409:822
[19]NevoE,BeilesA,Ben2ShlomoR1EvolutionaryDyna2
micsofGeneticDiversity1NewYork:Springer2Verlag,1984
[20]ChakravartiA1NatureGenet1,1999,21:56
[21]InternationalHumanGenomeSequencingConsortium1
Nature,2001,409:860[22]宋林生,秦松,相建海.99’海洋高新技术发展研讨会论
文集.北京:海洋出版社,299
[23]KloseJ,KobalzU1Electrophoresis,1995,16:1034
(上接第90页)
TheSynthesis,StructureCharacterizationandQuantumChemical
Calculationof4,4′2dis(92Carbazole)Biphenyl
LiXin,HuangYudong,NiuHaijun,BaiXuduo,ZhangGuiling,ChenJiushun(DepartmentofAppliedChemistry,HarbinInstituteofTechnology,Harbin150001)
Abstract
4,4′2dis(92Carbazole)biphenyl(DCBP),whichisaholetransportmaterialandhasasymmetricalstruc2ture,wassynthesizedbyUllmannreactionwith4,4′2disiodo2biphenylandcarbazole1ThestructureofDCBPwas(DIBP)characterizedwithIRandNMRspectra1Somequantumdatasuchasionizationenergy,advancedlinearorbitallevelandconjugatedenergywerecalculatedbyquantumchemicalinitialcalculationmethod1TheresultsindicatedthatthethermalstabilityofDCBPisbetterthanthatofTPP,whichissimplyexplainedintheory1
Keywords:DCBP,TPD,Holetransportlayer,Quantumchemicalcalculation
—103
—