16srRNA序列同源性分析与细菌系统分类鉴定
004 16s rRNA 序列同源性分析与细菌系统分类鉴定
中国预防医学科学院营养与食品卫生研究所 (北京 100050)
焦振泉 刘秀梅综述 孟昭赫审校
摘要 本文介绍了16s rRNA 序列测定及同源性分析的方法, 并阐述了其在细菌系统分类鉴定中的重要作用。
关键词 16s rRNA 序列同源性分析 细菌 分类鉴定
近10多年来, 随着分子生物学理论和技术的迅速发展, 特别是作为生物技术里程碑的聚合酶链反应(PCR ) 技术的出现及核酸测序技术的不断完善, 产生了许多新的分类方法, 如:质粒图谱、限制性片段长度多态性分析、脉冲场凝胶电泳、PCR 指纹图、rDNA 指纹图、16s rRNA 序列分析等。它们主要是对细菌染色体进行直接的DNA 分析或对染色体外的DNA 片段进行分析, 从遗传进化的角度去认识细菌, 从分子水平进行分类与鉴定, 使细菌的分类越来越科学和精确, 特别是16s rRNA 序列分析方法的出现使细菌进化可以通过试验研究来证实。这是细菌分类史上的一次革命, 必将使人们对生物进化及其与其它生物学科关系的认识更加深入。1 16s rRNA 的结构与性质
16s rRNA 为原核生物核糖体中一种核糖
体RNA 。目前, 在细菌的系统分类学研究中最有用的和最常用的分子钟是rRNA , 其种类少, 含量大(约占细菌RNA 含量的80%) , 分子大小适中, 存在于所有的生物中, 特别是其进化具有良好的时钟性质, 在结构与功能上具有高度的保守性, 素有“细菌化石”之称。
rRNA 在大多数原核生物中都具有多个拷贝[1], 5s 、16s 和23s rRNA 的拷贝数相同[2], 16s rRNA 由于大小适中, 约115kb 左右, 既能体现不同菌属之间的差异, 又能利用测序技术来较容易地得到其序列, 故被细菌学家及分类学家所接受[3]。所以, “细菌系统学研究特设委员会”建议依据系统发育关系分类。通过对其序列的分析, 可以判定不同菌属、菌种间遗传关系的远近。细菌的16s
[4]
rRNA 的可变区位点结构如下:
可变区(variab le regi on , V 1~10) V 1:61~106bp V 2:121~240bp
~500bp V 3:436
~754bp V 5:734
~671bp V 4:588~857bp V 6:829
~1045bp V 8:1118~1160bp V 7:990
~1298bp V 10:1410~1492bp V 9:1240
恒定区(con stan t regi on )
可变区序列因不同细菌而异, 恒定区序列基
本保守, 所以, 可以利用恒定区序列设计引物将16s rRNA 片段扩增出来, 利用可变区序列的差异来对不同菌属、菌种的细菌进行分
(NA +NB ) SAB =2NAB
NA 、NB 分别为两样品中各自具有的长度为L 个核苷酸以
类鉴定。但较其它方法而言, 16s rRNA 序列
测定分析更适用于确定属及属以上分类单位的亲缘关系。
2 16s rRNA 序列测定与分析方法
上的寡核苷酸残基数目, NAB 是两样品中共同具有的寡核苷酸残基数
对不同细菌的16s rRNA 序列进行同源性比较分析是推断细菌的系统发育及进化关系的一个重要方法。这些序列主要通过寡核苷酸编目(o ligonucleo tide cataloging ) 、克隆序列的测定、反转录直接测序、对PCR 扩增产物的直接测序等方法获得。211 寡核苷酸编目
采用已知碱基专一性的核酸酶(如RN ase T 1) 彻底消化RNA , 消化产物用层析和电泳双向分离, 放射自显影记录结果得初级指纹图, 再对初级指纹图上的每一个点进行序列分析, 最后依字母顺序和链的长短将所试rRNA 的所有寡核苷酸列出一个目录式清单进行编目, 并据此计算不同rRNA 间的相似数(SAB )
最后用SAB 构建系统发育树[5]。
[6]
W oese 等利用RN ase T 1对16s rRNA 进行寡核苷酸编目, 建立了原核生物系统发育的总体框架。
寡核苷酸编目只利用了rRNA 上40%的信息, 现今, 由于核酸快速测定技术的发展, 该法已被其它的序列分析法所取代。212 其它几种方法
这些方法主要是利用16s rRNA 恒定区序列特别保守的特点, 在恒定区上设计引物, 将细菌16s rRNA 扩增出来, 读取16s rRNA 序列, 对不同细菌的16s rRNA 进行同源性比较及分析。
目前比较通用的几种16s rRNA PCR 扩增引物见附表[7]。
附表 目前比较通用的几种16s rRNA PCR 扩增引物
引物1
fD 1fD 2fD 3fD 4rD 1rP 1rP 2rP 3
1
) 序列2(5’~3’
ccgaattcgtcgacaac A GA GT T T GA TCCT GGCTCA C ccgaattcgtcgacaac A GA GT T T GA TCA T GGCTCA C ccgaattcgtcgacaac A GA GT T T GA TCCT GGCT TA G ccgaattcgtcgacaac A GAA T T T GA TCT T GGT TCA G cccgggatccaagcttAA GGA GGT GA TCCA GCC cccgggatccaagcttA CGGT TA CCT T GT TA CGA CT T cccgggatccaagcttA CGGCTCCT T GT TA CGCT T cccgggatccaagcttA CGGA TA CCT T GT TA CGA CT T
适用范围大多数真细菌肠道细菌及其相关细菌
S p irochetes 疏螺旋体
衣原体属许多真细菌肠道细菌大多数真细菌梭杆菌
引物缩写:f :正向 r :反向 D :远端 P :近端。带f 的包含ECoR 和Sal 的位点; r 包含H ind 和BamH 和Xm al 识别序列; 反向引物产生rRNA 的互补序列; rP 1、端开始的第17个碱基不同外全部相同。rP 2、rP 3除从3’所有引物序列方向都从5’~3’, 连接序列包含用小写字母写的克隆用酶切位点;
2
由于细菌染色体上的rRNA 基因以复
数存在(约10个左右) [8], 当译读PCR 产物的直接序列时, 复数拷贝如不全是相同序列就译读不出来, 即使拷贝间有不同时, 也只限于变异较大的区段, 稳定区段拷贝间并无不同。rRNA 基因拷贝间有不同时, 只能克隆后
再测序, 而且克隆之后有利于重复测序及以
后的工作, 所以建议将PCR 扩增的16s rD 2NA 序列进行克隆。克隆时可根据对大部分细菌16s rDNA 序列的检索, 选择合适的酶切位点, 在设计引物时在引物的5’端修饰进行粘端克隆。常用的克隆载体为PU C 系列
及M 13系列。这样有益于产生单链进行测序, 但如果所测序列为未知序列, 难于找到合适的酶切位点进行粘端克隆时, 可利用PCR 扩增产物的3’端总带有一个A 的特点, 选择一个5’端带有一个T 的载体, 现在, T 2V ec 2to r 易于制备且有商品出售, 故一般采用PGE M 2T 2V ecto r 系统进行克隆。
另外还可以通过对16s rRNA 反转录产物进行直接测序。D avid 等[9]阐述了一种用于细菌系统分离的快速rRNA 序列测定方法, 该法以rRNA 为模板, 以一个或多个寡核苷酸作引物, 利用反转录酶合成c DNA , 进行Sanger 双脱氧链终止法测序。但由于RNA 在RN ase 作用下极易降解, 而且很难
时有许多种方法, 其中有4种方法主要是根据聚类分析来进行的[16], 它们分别为利用算术平均数的加权配对分组方法(w eigh ted p air group m ethod u sing arithm atic aver 2ages , W PG M A ) , 利用算术平均数的非加权
配对分组方法(unw eigh ted p air group m ethod u sing arithm atic averages , U PG M A ) , 单个连锁分析(single linkage ) 及完全连锁分析(com p leted linkage ) 。3 16s rRNA 序列分析在细菌分类鉴定中的
保证不受RN ase 的污染, 所以采用测定16s rDNA 序列。即提取细菌总的染色体DNA , 利用保守的16s rRNA 引物进行PCR 扩增, 得到细菌的16s rDNA , 这时可利用保守引物对扩增产物直接测序, 亦可将此16s rRNA 克隆后再测序。由于16s rRNA 约115kb , 一套反应不能全部读取, 所以可利用所取得的核苷酸序列设计新的寡核苷酸, 充当后一套反应的引物, 从而循序渐进地获得所有16s rRNA 片段的序列[10]。213 序列分析方法
取得16s rRNA 序列后, 从基因数据库中调取所需16s rRNA 序列, 利用一些必要的计算机分析软件对它们进行同源性比较, 进而绘制系统进化树。
现在比较通用的核酸序列数据库有GenBAN K (nati onal in stitu tes of health ) 、E M BL (Eu rop ean m o lecu lar b i o logy labo ra 2
[11]
to ry ) 、DDBJ (DNA data bank of Jap an ) 。比较通用的序列分析软件有Squence 、
菌Ph ili p s 、T reecon 和GCG 。计算不同菌属、
种之间的遗传距离的方法主要有Jukes 和
[12][13]
Can to r 方法、T aji m a 和N ei 方法、
[14][15]
其中前K i m u ra 方法及J in 和N ei 方法。两种方法为单一参数模式, 后两种方法为双
参数模式。在取得遗传距离之后构建进化树
作用
16s rRNA 的同源性分析最适用于属及属以上的远缘关系。目前, 已对2000种(约相当于50%) 以上的真细菌的16s rRNA 进行了测序, 不同菌属的16s rRNA 序列同源性为70%~95%, 对分类而言, 至少需要测1000bp 以上。通过同源性比较, 可以了解不同菌属、菌种在遗传进化方面的距离。
经过16s rRNA 同源性的比较, 结果有时与传统分类结果不符, 发现一些新的种属。
[17]
Funke 等测定从人体分离到的棒杆菌依赖补体细胞毒性 组及其类似棒杆菌的16s rRNA 序列。通过对这些序列的比较发
现这两个棒杆菌组都属于放线菌属, 再结合其它的分子实验结果及以前的生化试验结果, 提出其为放线菌一个新种, 即钮氏放线菌种(A ctino m y ces neu ii . ) , 包含钮氏放线菌钮氏亚种(A ctino m y ces neu ii subsp . neu ii . ) (棒杆菌依赖细胞毒性 组) 和钮氏放线菌无硝亚种(A ctino m y ces neu ii subsp . an titra tus ) (棒杆菌类似依赖细胞毒性 组) 。
B ennasar 等
[18]
测定并比较了14株施氏
假单胞菌, 其中包括模式株CCU G 11256和Zobell 株(A TCC 14405) , 它们代表了已知的施氏假单胞菌的7个不同基因型(DNA 2DNA 杂交同源组) , 结果与DNA 2DNA 杂交所得到的基因型高度相关, 并且鉴定了每个基因型的核酸特征位置, 结果还发现第6基因型SP 1402T (T =模式株) 和SL 401与施氏
完全而且个人读取数据也可能出现错读, 因此由16s rRNA 序列鉴定种是很难的, 必须结合与近缘菌种的DNA 2DNA 杂交实验。
利用16s rRNA 测序鉴定病原菌是很有
[22]
必要的。R el m an 等利用16s rRNA 序列中的保守区段设计了寡核苷酸引物, 用来扩增杆菌性血管瘤病人的靶DNA 序列。他们还发现在具有一定病症的病人的组织污染物中已发现有细菌形成, 但并没有培养出致病菌, 从这些样品的16s rRNA 扩增产物的序列分析可以看出:致病菌为一种立克次氏体属组织, 现在称为汉氏巴尔通氏体[23, 24]。近几年来, 人欧利希氏病[25]、肠原性脂肪代谢障碍[26, 27]和少菌性骨髓炎[28]的致病因子也是通过PCR 扩增16s rRNA 进行序列分析发现的; 同样, 疏螺旋体的不同区域分离物根据此法也已被鉴定[29]。在北美洲和欧洲的蜱传染性螺旋体病人身上存在的不同疏螺旋体属的16s rRNA 序列分析解释了为什么这两大洲的蜱传染性螺旋体病的症状不同。
随着大部分细菌的16s rRNA 序列的获得以及核酸扩增16s rRNA 序列测定自动化分析系统的问世, 必将引起细菌分类的一次重大变革, 它可以使人们进一步了解细菌的进化关系, 从而产生以16s rRNA 序列分析为主体的所有细菌的系统发育树。
参考文献
1234567
. J Bacteri o l , 1997; 132:9312Kenerly M E et al 949
Gin sberg D and Steitz JA . J B i o l Chem , 1975; 250:564725654
Sogin and Gunderson . A cad Sci , 1987; 1503:1252139
假单胞菌模式株明显不同, 从而建议它们应
该属于一个新种, 命名为P seud o m onas ba lea rica 。
有时16s rRNA 序列同源性比较结果对传统的分类结果给予了证实并提供了更多的分类依据。
[19]
Gaydo s 等通过对肺炎衣原体的1554bp 16s rRNA 序列与鹦鹉热衣原体及砂眼衣原体的16s rRNA 序列进行同源性比较并绘制了系统进化树, 发现肺炎衣原体与后二者的同源性分别为96119%和94107%, 证实了以前根据其它方法研究所得出的结论, 同时说明从遗传进化角度来看, 肺炎衣原体与鹦鹉热衣原体的进化关系比与砂眼衣原体的关系更近。
蠕虫新立克次氏体是沙门氏菌中毒疾病的致病因子, 它是唯一一种已知的通过蠕虫传播的专一性细胞内细菌, 通过测定它的1453bp 的16s rRNA 序列并与P rotecobac 2
teria 的Α组的细胞内序列进行比较发现, 蠕
虫新立克次氏体与埃里希氏体属的两个种即里氏埃里希氏体和腺热埃里希氏体特别相似(相似性>95%) , 而埃里希氏体属的其它种则与之相距较远。这个结果证实了以前通过超微结构和蛋白质印迹(W estern b lo t ) 所得的结论。埃里希氏体属可被分为3个相似的种, 每一个种都与其它非埃里希氏体属的一个菌种相近。蠕虫新立克次氏体、里氏埃里希氏体和腺热埃里希氏体之间的相近及与埃里希氏族其它菌属的显著不同, 意味着这些菌种将作为从埃里希氏体属中分离出来的一个新的细菌属而存在[20]。
目前起确定微生物种决定作用的是DNA 2DNA 同源性的程度, 一般的标准是70%以上同源定为种的范围。16s rRNA 序
现代细菌分类鉴定法1中日细菌分类鉴定和诊断分子生物学新技术研讨班讲义
. M ethods M icrob i o l , Staclceb randt E et al 1985; 118:752107
Fox GE and W oese CR . Science , 1980; 209:4572463
. J Bacteri o l , 1991; 173:6972W illiam G et al 703
列和DNA 2DNA 同源性相关关系的研究表明[21]:序列的相同性不在9918%以上就不能达到70%以上DNA 2DNA 的同源性。16s rRNA 总共约有1500bp , 012%的不同相当于3个碱基。由于数据库中的数据不一定
8910
. J M edM icrob i o l , 1989; 30:892Ow en RJ et al 99
. D avid JL et al
P roc N atl A cad Sci U SA ,
20212223
p ro tein
[1**********]9
1985; 82:695526959
Sam b rook J ed . M o lecu lar C lonn ing :Co ld Sp ring H arbo r . 1989:[1**********]
2nd ed , L abo rato ry P ress ,
19
. In t J Sys Bacteri o l , 1993; 43:Gaydo s C et al 6102612
. In t J Sys Bacteri o l , 1995; 45:Charles P et al 2072211. Stack E et al 8462849
. N Eng J M ed , 1990; 323:15732R el m an et al 1580
. M o l M icrob i o l , 1992; 6:18012R el m an et al 1807
. J C lin M icrob i o l , 1992; 30:W elch D F et al 2752280
. J C lin M icrob i o l , 1992:A nderson BE et al 30:7752780
. L ancet , 1991; 338:4742475W ilson KH et al
. N Eng J M ed , 1992; 327:2932R el m an et al 301
. J C lin M icrob i o l , 1993; 31:6462M eler A et al 652
. J C lin M icrob i o l , 1992; 30:M arcon i R T et al 283022834
收稿日期:1997206219 修回日期:1997210214
In t J Sys Bacteri o l , 1994; 44:
王槐春1蛋白质与核酸序列分析基础1北京:人民军医出版社, 1994:2210
Jukes
TH
et
. al
M amm alian
m etabo lis m . 1969:212132
N ew Yo rk :A cadem ic P ress ,
[1**********]8
. M o l B i o l Evo l , 1984; 1:2692T aji m a FM et al 285
. J M o l Evo l , 1980; 16:1112K i m u ra M et al 120
. M o l B i o l Evo l , 1990; 7:822102J in L et al
Sneath PHA and Sokal RR . N um erical T axon 2om y . San F rancisco , 1973:2512265. Funke G et al (1) :1672171
. In t J Sys Bacteri o l , 1996; 46Bennasar A et al (1) :2002205
In t J Sys Bacteri o l , 1994, 44
(上接第11页) [**************]7
. Sam arajeew a U et al 1991; 29(1) :41247
. J Environ Patho l Tox ico l N atarajan KR et al
O nco l , 1992; 11(4) :2172227
. Cancer , 1991; 20(4) :1042106L in K M et al
. N at Tox in s , 1995; 3 4:2042Ph illi p s TD et al 213
. J Food Sci , 1995; 60(3) :C iapara I H et al 6452647
. B i ochem J , 1993; 292:13218Judah DJ et al
. Cancer R es , 1993; 53:38872H ayes JD et al 3894
. Carcinogenesis , 1996; 17T akahash iN et al
收稿日期:1997204230 修回日期:1997208214
Food Chem Tox ico l ,
181920
(1) :79287
. Cancer R es , 1991:51(20) :Roebuck BD et al 550125506
. Cancer R es , 1996; 56(10) :Bueler TM et al 230622313
. EUA SC 225(A b stract book of L iu DL et al
the fifth eu rasia conference on chem ical sci 2ences ) , 1996:18021
. A cad J Guangdong Co ll Pharm , L iu DL et al 1996; 12(3) :1662168