分子生物学论文中同源性_相似性_一致性使用调查及规范探讨_宋亚珍
分子生物学论文中同源性、相似性、一致性使用调查及规范探讨
宋亚珍
刘
枫
潘新社
裴阿卫
南红梅
*
收稿日期:2012-02-28修回日期:2012-08-05
《西北植物学报》712100西北农林科技大学编辑部,E-mail :xbzwxb004@nwsuaf.edu.cn 陕西杨凌,
摘要‘同源性、相似性、一致性’具有不同含义,同源性是指在来源上的同一性; 相似性是指功能或特点上的趋同性; 一
致性是指简单一致度。通过中国知网,对2000年以来的期刊论文调查发现,这3个词语在序列生物信息学分析论文中的混淆使用频率相当高,这可能与作者和编辑的概念不清有关。关键词
生物信息学
同源性
相似性
一致性
序列比对
AGL14同源性为50%。
例5……其单个外显子核苷酸序列与拟南芥
(Arabidopsis thaliana )LEAFY 基因同源性在90%以上,氨基酸序列同源性为86%,而与琴叶拟南芥(Arabidopsis lyrata )的氨基酸序列同源性高达90%。
例6……对其推导氨基酸的序列分析表明Chi58与沙雷
氏菌的几丁质酶(ChiA )有高度同源性(88. 9% 99. 6%)。
…同源率分别达例7……测序及同源性分析结果证实,
94. 18%、93. 12%、93. 10%和89. 17%。……同源96. 14%,……同源性分别为性分别高达96. 15%、
84. 13%、83. 18%,……一致性相对较低,分别为82. 12%、79. 11%、77. 11%和76. 16%。
例8……其核苷酸及氨基酸的同源性分别为83. 0%
100. 0%和87. 9% 100. 0%。……在系统发生分析中具有较高的一致性。
例9……经数据库同源查找及序列比较,发现……具有
30%、22%的同源性和46%、40%的相似性。例10……同源性分析表明,在核苷酸和氨基酸水平上,
猪、人和牛PSP 基因同源性较高。
例11……经生物信息学分析,发现20个片段与已报道
的基因有较高同源性。
从抽查的诸期刊案例中可以看出,序列比对分析的结‘同源性的百分数’果中,多以来表述序列间关系(例1 9),、‘高度同源性’有的叙述为‘同源性较高’或‘同源性
、在分子生物学文献中,常常采用“同源性(homology )”“相似性(similarity )”、“一致性(identity )”等来描述目标基氨基酸等序列的亲缘关系,推论其结构或功能。同源性因、
是指来自同一祖先,在进化起源上同一;相似性是指不同祖由于趋同进化形成的共同结构或功能特点;一致性先来源,
比如序列中碱基或氨基酸位点是指具体特征上的简单一致,
的简单同一性。因此,这3个词语具有不同的内涵和作用
[1-5]
。然而,笔者在多年的编辑工作中发现,很多稿件中
这些词语使用混乱。进一步通过中国知网,调查自2000年“同源性”“一致性”、以来发表的期刊论文,分别以全文包含“同源性”“相似性”“相似性”“一致性”,包含和包含共搜索13644、27677条信息。对这些信息随机抽查发现,到6013、
这3个词语的错误使用频率非常高,其中不乏一些知名学术期刊的论文。本文列举了部分调查结果进行分析,以期与同仁共勉。
1有关同源性的表述
例1……序列同源性比较表明,与拟南芥(Arabidopsis
thaliana )染色体ⅢBAC 库中的F14P3基因组序列具有88%的同源性。
例2……序列测定表明,此片段与发表的豌豆和马铃薯
GBSSI 基因相应序列同源性分别达89. 6%和73. 0%。……而成熟蛋白氨基酸序列同源性较高。例3……彼此之间的氨基酸序列同源性为91. 3%。它
们与其他植物的同源性高达90%以上。
box 基因例4……推测的氨基酸序列与拟南芥的MADS-
*通讯作者:南红梅,女,编审。
http :cjstp.ijournals.cn
2013,24(2) 中国科技期刊研究,
—404—
高’等(例2 11);有的论文还将‘同源性’和‘一致性’或‘相似性’混合叙述(例7 9),混淆了三者概念。而事实,‘同源性’上是指物种起源上的同一关系,在共同祖先、共结合物种进化历史所得出物种间关系的结同血缘前提下,
‘质’,论,是的范畴,是‘有’或‘无’没有量的差别,不能以‘百分数’来表述。
所以‘同为:序列A 和序列B 一致性(相似性)为百分之几,源性’高达百分之几,所以A 和B 同源。基因或物种的同源‘相似性、性判断不是简单依赖于一致性’数值,还需要物种。《生物化学与分子生物学名词》中给起源进化上的依据
‘DNA 同源性(DNA homology )’的定义:不同的DNA 分子由于进化上的原因,其核苷酸序列具有相同来源而具有的某些共性,表现在相应的位点具有相同的或相似的核苷酸残基
[6]
2有关一致性和相似性的表述
例12……人Tectb 基因与小鼠Tectb 基因在990bp 有
88. 1%的一致性,在329个氨基酸有94. 2%的一致性。
例13……它们之间核苷酸序列的一致性大于55. 4%,
读码框氨基酸序列一致性大于79. 8%。与其他物种KAP6s 比较,绒山羊的6个cDNA 和绵羊的KAP61cDNA 的序列一致性最高,为81. 9% 98. 8%,不同物种KAP61之间氨基酸序列一致性大于50%。
例14……该序列经生物信息学分析发现,其与拟南芥
TIR1相似性为77%。
例15……所得序列(命名为MIAc )与GenBank 中注册
的肌动蛋白基因序列的相似性均在60%以上,与其他肌动蛋白氨基酸序列的相似性达89%以上。例16……在GenBank 中进行Blastp 检索,发现其与许
多物种的MAPK 基因具有较高的相似性(55. 6% 69. 7%)。
‘一致性(identity )’是具体比对序列的简单一致程度,
。从这个定义可以看出,首要条件是‘进化上具有相同
,‘表现为位点的相同或相似’。即命题A (不同的然后来源’
DNA 分子由于进化上的原因,其核苷酸序列具有相同来源而具有的某些共性)成立,所以命题B (表现在相应的位点具有相同的或相似的核苷酸残基)成立。反之,我们不能简单地推测因为命题B 成立,所以命题A 成立。
之所以3个词语混淆使用在学术论文中频繁出现,与作者和编校人员的概念不清、不屑于深究有直接关系。对于作研究过程中可能过分依赖分析软件,没有很好地理者而言,
解所提供参数代表的具体意义和使用范畴,对同源性的判断也过于简单,导致表述不准确。对于编校人员来说,正确理解这3个词语的含义及其差别非常重要。编辑加工是在研究者认识的基础上对科学研究成果的精炼过程,也是对科学信息进行甄别、提炼的重要关口。编校人员一是要有高度的二是具有扎实专业知识,严格辨析稿件专业词语的责任心,
应用情况,确保科研信息的正确描述,提高期刊质量。因此,学术期刊编校人员应与相关专业人员多交流,了解目前研究也需要不断加强专业知识的学领域出现的新进展和新名词,
习,扩大专业知识面,以提高在稿件的审理、编辑加工方面所需的专业素养。参考文献
1
现代高级英汉双解辞典(英汉版,内部交流,繁体印刷).香港:牛1978:527,1017津大学出版社,2
李行健.现代汉语规范词典.北京:外语教学与研究出版社,语文2004:1307,1420出版社,3
宋亚珍,南红梅,刘枫,潘新社,裴阿卫.同源性、一致性和相似性2011,13(2):48-50辨析.中国科技术语,4
2003:70-76赵国屏.生物信息学.北京:科学出版社,
来茂德.医学科学研究中的生物信息学应用.浙江大学学报:医2004,33(2):91-94学版,6
全国科学技术名词审定委员会.生物化学与分子生物学名词,北2008:153-154京:科学出版社,
;‘相似性(similarity )’不考虑比对序列的起源和功能是比对不考虑序列的具体起序列(产物)功能或特点的趋同程度,
源。在进行序列比对分析时采用的生物分析软件根据输入‘一致性’同时给出比对结果或参数会自动生成比对序列图,
‘相似性’,这些都是软件自带功能。作者可根据软件分析结果如实叙述(例12 16)。
3建议和探讨规范表述
‘同源性’、‘一致性’‘相似性’cDNA 、和一般是在DNA 、
5
RNA 或氨基酸序列比对分析中用到,纵观此类论文,可以看‘同源基因(序列)’满天飞。这类研究中多采用生物信息到
‘相似性’‘一致性’软件,得到序列间或的百分比。通常描述
http :cjstp.ijournals.cn 2013,24(2) 中国科技期刊研究,
—405—