专业性搭配初探_语料库语言学方法_卫乃兴
第24卷 第4期 2001年7月解放军外国语学院学报
Journal of PLA University of Foreign Languages Vol. 24 No. 4 J uly 2001
专业性搭配初探
———语料库语言学方法
卫乃兴
(上海交通大学外语学院, 上海200030)
摘 要:专业性搭配是“在专业文本里以大于偶然的概率共现于同一语法结构内、实现一定专业意义的词语组合”。用语料库语言学方法对上海交通大学JDEST 语料库等进行的研究表明, 专业性搭配在专业文本中实现韩礼德所说的概念意义和篇章意义等, 并呈现若干典型的类联接特点。
关键词:词语行为; 专业文本; 专业性搭配; 类联接; 意义实现
中图分类号:H31310 文献标识码:A 文章编号:10022722X (2001) 0420019205
A Study of Specialized ———A Corpus 2WEI (Institute of Foreign Languages , Shanghai , 200030, China )
Abstract :Specialized collocation is a items which co 2occur in a grammatical construction with mutu 2al expectancy greater than specialized texts ”. Based on JDEST of Shanghai Jiaotong University , this study finds that can realize what Halliday calls “ideational ”, “textual ”and other meanings , and exhibit strong colligational K ey w ords :lexical behaviour ; specialized text ; specialized collocation ; colligation ; realization of meaning
0. 引语:
按照J ・R ・弗斯(Firth ) 的观点, 词语的结伴或共现关系是其重要表现形式; 词语搭配是一种意义方式; 习惯性搭配中的词项相互期待和预见(expect and predict each other ) ; 词语搭配现象与类联接(colligation ) 有一定联系。弗斯的这些观点对研究词语搭配具有重要的启示和指导意义。过去
20多年间, 国外语言学者运用语料库语言学的方法和理念
理论框架对它进行了界定(卫乃兴, 2001a ; 2001b ) , 殊异甚多。本文所说的专业性搭配, 是指“在专业文本里以大于偶然的概率共现于同一语法结构内、实现一定专业意义的词语组合序列”。语料库的专业文本, 是指那些旨在表达和交流思想而自然形成于学术和科技领域的论文、研究报告、科学教科书片段、学术讲稿等。专业文本不同于普通文本, 它的对象读者群较为狭窄, 一般是同一专业领域的同行或学生; 一般都有较为实用的交际目的, 而不是为了消遣、欣赏等; 它的内容都有较强的专业性, 外行人一般难以理解。专业文本包括多种题材领域和体裁形式。本研究用的专业文本来自上海交通大学JDEST 语料库。该语料库建于上个世纪80年代, 后经几次扩建, 目前含有400万词的连续文本(running
texts ) , 包括有化工工程、生物工程、机械工程、电气工程、
对词语搭配进行了卓有成效的研究。(Jones &Sinclair , 1974;
Sinclair ,
1987,
1991,
1996;
K jellmer ,
1984,
1987,
1991;
Kennedy , 1990) 词语搭配无疑是语料库语言学最为活跃的研
究领域, 处于它的中心地位。然而, 国内学术界所做的同类研究却尚不多见。根据卫乃兴(2001a ) 对词语搭配的界定体系, 搭配可分为一般搭配、修辞性搭配、专业性搭配和惯例化搭配4种。本文试图参照弗斯的有关思想和这一界定体系, 对专业性搭配进行研究。
1. 专业性搭配及有关概念界定
计算机科学、管理科学、物理学、医学、教育学、心理学、社会学等近30个专业领域。文本的体裁形式有学术论文、摘要、引语、研究报告、专利书、科学教科书等。本文将以这些文本中的词语行为为依据对专业性搭配进行研究。另
自弗斯提出词语搭配概念以来, 语言学者用种种不同的收稿日期:2001-01-29
作者简介:卫乃兴(1955-) , 男, 河南济源市人, 上海交通大学外国语学院副教授, 博士, 主要研究方向为语料库语言学、应用语言学。
・20・解放军外国语学院学报2001年
外, 作者将用容量均为100万词的Brown 语料库和LOB 语料库的语料进行对比研究。后两者将注明出处, 前者不注。
在上述定义中, “在专业文本里”揭示了专业性搭配的语域界定特点。词语搭配很大程度上要受制于语域因素。英国的房地产商在做广告时常用“delightful residence ”、“taste 2
fully modernized ”、“having the benefit of double glazing ”等词
高于其期望频数(expected frequency ) 至一定程度, 该序列便不是词语的偶然行为, 而是一种典型性行为。另一个方法是用Z 值、T 值或MI 值(Mutual Information Value ) 测量关键词与有关词项在文本中共现概率的显著性。(卫乃兴,
2001a ) 如果具有显著性, 则表明它们是以大于偶然的概率共现, 反映了词语行为的典型性。
专业性搭配“共现于同一语法结构中”, 这是其另一界定特点。在本研究中, 只有在同一语法结构中共现的词语才被视为搭配; 该语法框架被界定为搭配的类联接。这一观点不同于韩礼德(Halliday ,1966) 和辛克莱(Sinclair ,1966) 等人的观点。他们认为, 相互搭配的词不一定位于同一语法结构内。
专业性搭配是“实现一定专业意义”, 这是其又一界定特点。本研究采用韩礼德的意义体系, 探讨词语搭配实现的
语搭配; 关于资本主义国家劳资关系的新闻报道中常出现“stage industrial action ”、“propose redundancies ”和“threaten
cuts ”等词语搭配。(McCarthy , 1995:64)
“以大于偶然的概率共现”是专业性搭配的另一个重要界定特点, 体现了弗斯所说的词项间的相互期待性(mutual
expectancy ) 。词语搭配研究不是探讨词项组合行为的可能
性; 在一定的情景下, 词项的任何组合都是可能的, 甚至像
“Colorless green ideas sleep furiously ”和“This lemon is sweet ”概念意义、人际意义和篇章意义。无论是技术词汇和次技术词汇都吸引一定数量的别的词语来实现意义。下面, 我们以这样的组合, 在一定的语境中也不是不可能的。(McIntosh ,
1967:181-199) 与此相反, 词语搭配研究的是词项组合行为
“in +patients +with +N ”这一搭配序列为例, 说明上述几点。“patients ”一词, 在医学领域表示“患者”之意。在
JDEST 中, “patients 948, 但“in +pa 2tients +with +”出现高达, 下面只显示
的典型性(typicality ) 。只有在文本中反复共现的词语才体现典型性。在语料库研究中, 典型性可由两种方法测量。一是直接观察由KWIC (K ey Word in Context ) 方法检索的词语序列频数:如果一个序列的观察频数(observed frequency )
4, acute illnesses whether or underlying chronic lung disease. 1of these problems are diverse. In , bleeding
2ulting from GNB occur principally 3e of worsening “In ”、“patients JDEST 中的观察频数分别为87133、948; 三者组合为搭配序列的期望频数是01134; 该序列的观察频数是66; 观察频数与期望频数之比是49215。(关于搭配序列的期望频数计算方法,
) 由这一比值可知, 该序列在JDEST 中见卫乃兴〈2001a 〉
alcoholic liver disease , bleeding can be secondary to dietary vitamin K deficiency. /临床性大出血可能发生于活组织检查和外科手术时。导致这些问题的原因是多种多样的。就酒精引起的肝病患者而言, 出血可能继发于食物中缺乏维生素K 。
无论从观察频数的显著性, 还是从构成形式和所表达的意义来看, “in patients with ”都符合我们界定的专业性搭配的标准。它揭示了词语搭配的典型性, 而不是可能性。根据
极其显著, 是个典型搭配。再看该序列的形式构成:3个词共现于同一语法结构内, 类联接为PREP +N +PREP 。介词
、“in regard to patients of ”、“with ”后的N 一般是表示具体疾病的名词, 如“stroke ”、一般的句法理论, “in patients of ”
“liver disease ”、“leukemia ”、“diabetes ”等; N 也可是表示具“as far as. . . patient is concerned ”等说法都是可能的, 但在体症状的名词, 如“immune deficiency syndrome ”、“dissemi 2
nated infection ”等。“in +patients +with ”在医学文本中用的
我们所用专业文本中都没有实例, 因而不可能是典型的。此外, “in patients with ”实现的意义也是典型的专业意义, 只有在医学专业文本中, 它才被用来表达类似“as far as. . .
patient is concerned ”的篇章意义。LOB 仅有一例“in pa 2tients with ”, Brown 也仅有一例“patients with ”, 且分别出
如此之多, 以至于现在已经有了一个新的意义, 即“就……的患者而言”, 如上述词语索引1的详细引句所示:
1Clinically significant bleeding may occur with biopsies and surgery. The causes of these problems are diverse. 现于各自的医学文本。下面是有关的索引:
Brown :properly. Several dentists and patients with special dental problems have e
JDEST 语料库分属30个题材领域的专业文本中, 都有各自常用的词语搭配。这些词语搭配大都有如下特点:(1) 在普通英语文本里使用得较少, 但在某类专业文本里出现的频率很高; (2) 在专业文本中表达具体的专业概念、思想和
211 概念意义
按照韩礼德(1985:53) 的体系, 意义在宏观上可分为3类:概念意义(Ideational meaning ) 、人际意义(Interper 2sonal meaning ) 和篇章意义(Textual meaning ) 。概念意义表
活动, 并起着组织语篇信息的重要作用; (3) 呈现出一定的述的是人们在客观世界里的经历以及在内心世界里的想象。类联接特点和规律; (4) 是科技和学术研究人员表达思想、人际意义表述的是交际双方用语言做事, 使交际得以进行下交流信息的重要词语手段, 是词语搭配的一个重要子类。
2. 专业性搭配所实现的意义
去的活动。篇章意义直接关系到语篇信息的安排和组织。词语搭配同样实现这3种意义。这里着重分析专业性搭配实现
第4期卫乃兴 专业性搭配初探 ・21・
的概念意义和篇章意义, 以词形“experiments ”的有关搭配为例。在本研究中, “experiments ”被称为节点词(node
word ) , 在JDEST 中的观察频数为670; 研究取节点词左右
数据表明, 表1中的词项都在一定程度上与“experi 2
ments ”构成了典型搭配, 并形成类联接是V (+DET )
+
N , 如“conducted (the ) experiments ”等。这一类搭配实现
各4个词为搭配语境, 称为跨距(span ) ; 所有落入跨距内的词项叫作搭配词(collocates ) 。我们用Z 值来表示搭配的显著程度, Z 值越大, 搭配词与节点词构成的搭配就越显著。一般来说, Z 值达到210以上时, 就可将搭配视为显著搭配(significant collocation ) , 即搭配词与节点词是以大于偶然的概率共现的。在JDEST 中, 与“experiments ”共现的动词及其统计数据如表1所示:
表1 词形“experiments ”的动词搭配词统计数据
Collocates Co 2occurrences Total Z 2score
with node occurrences conducted
performed carried (out ) demonstrate show reveal described designed presented suggest indicate controlled indicated reported
[***********]4
[***********][***********][***********][***********][***********]71的是各种概念意义, 表述了科技界常做的事情:描述、控制和报告实验等。
212 篇章意义
表1中的搭配词还与节点词共现于另一类联接N +V 中, 如“experiments demonstrate (show 、indicate 、sug 2
gest ) ”。这类搭配用来陈述作者的观点或评论, 实现的是篇
章意义。事实上, 专业性搭配在专业文本中发挥着组织、安排信息的重要语篇作用。现以学术论文的引语为例。根据斯威尔斯(Swales ) 的研究, 学术论文的引语一般由3个语步
(moves ) 组成:确立区域(Establishing a territory ) , 确立位
置(Establishing a niche ) 和占领位置(Occupying the niche ) 。(Swales , 1990:141) JDEST 的证据表明, 这3个语步分别都有各自的专业性搭配序列来组织语篇信息、揭示语步间的衔接。
21211 “Of particular interest :声称研究课题和研究
领域的中心地位
“, , 具有很高的价值等, “of particular interest ”这一搭配序列是重要的语篇手段。
1 Of particular interest is the possibility that the effec
2p are discussed. 3or fixed structures. Of particular interest Of particular interest are the results obtained from en are the wave loads on fixed stru 由上述索引可知, “of particular interest ”这个搭配序列有两个结构变体, 一个是“of particular interest are/is ”, 另一个是“is/are of particular interest ”。前者是一种语法结构上的倒装形式, 目的在于强调某个部分。用倒装形式时, 与研究专题有关的某个具体内容置于搭配序列的右边, 索引
1、2、3的情况即是如此。以索引2和3为例, 位于序列右
学术论文引语的第二个语步为“确立位置”, 但其信息与第一个语步里的信息却极不相同。如果说第一个语步里的语篇信息以强调研究专题的“重要性”、“意义”等为主的话, 第二个语步则是强调以往同类研究存在的“问题”、“弱点”或“差距”。通过指出本领域里同类研究的问题, 质疑其弱点, 揭示其差距, 研究者为自己的研究建立一个位置。JDEST 的证据表明, “recent studies show (have shown /indi 2
cated/suggested ) ”就是用来实现这一语篇意义的专业性搭
边的“the results obtained ”和“the wave loads on fixed struc 2
ture ”是与研究专题紧密相关的内容, 因此被说成具有
“particular interest ”。而位于序列左边的是介绍研究领域里一般信息的词语, 或者是简短提及与研究专题有关的问题的词语。倒装形式“Of particular interest is/are ”不仅仅出现在句首, 而且还出现在段首, 如索引3的情况。在这些情况下, 搭配序列把前一句与后一句或前一段与后一段的语篇信息连接起来。
用非倒装形式“is/are of particular interest ”时, 研究专题或相关的内容置于序列的左边。比如, 索引4中的“the
latter ”就是表示与研究专题有关的内容。这种形式的语篇
配。在斯威尔斯的体系中, 这一搭配及其整个语境被称为
“评述以往研究”(Reviewing items of previous research ) , 是第一个语步的一个语阶(step ) 。但笔者发现, “评述以往研究”往往和“确立位置”密切相联。研究者通常在评述以往研究时, 指出同类研究存在的问题和弱点等。如:
(1) However , evidence from recent studies has begun to cast doubt on such a method.
(2) Recent studies have indicated that the upper limit for transversely stiffened girders can be increased.
连接功能似乎没有倒装形式明显。但无论哪种形式, 都强调论文该处所报道的内容“特别重要”。
21212 “Recent studies show (have shown ) ”:评述或质疑以往研究
这一搭配中的动词主要用现在完成时形式, 即“recent
studies have shown (indicated/suggested ) ”。但用一般现在时的实例也不少, 如“Recent studies show (indicate/sug 2
ges t ) . . . ”等。研究还表明, “It is not clear ”等序列也被用
・22・
来实现相似的篇章意义。
解放军外国语学院学报2001年
with 、demonstrates 、examines 、investigates 、presents ”等动
21213 “This paper describes ”:宣布研究内容词构成的词语组合, 出现的频数相当高。而且, 在占76%的实例中, “paper ”一词前用的是限定词“this ”, 基本不用“the ”、“that ”等词。研究发现, 这些组合主要用于学术论文引语的第三个语步, 向读者揭示论文的主要内容, 实现斯威尔斯(1990:141) 所说的“宣布目前的研究”这一篇章意义。下面是含有“This paper describes ”的2行词语索引:
学术论文引语的第三个语步是“占据空间”, 其内容与第二语步紧密相承。在这里, 学术论文作者要证明自己的观点有根有据, 要回答提出的问题, 并试图填补空白。占据空间的方式可多种多样, 但“宣布本次研究的目的”或者“宣布研究的特点”一般是大多数引语都有的一步。在JDEST 中, 由“paper ”和“discusses 、describes 、reports 、deals
1y control , and scheduling. This paper describes the application of a s
总之, 学术论文引语的各个语步都习惯性地使用一些词语搭配序列, 实现具体的篇章意义或语篇功能。具体使用哪些搭配序列, 实施哪些语篇功能, 都已成为专业领域里的规 表2 专业性搭配的统计数据及其语篇功能
Collocations Frequency of constituents Of particular interest
It is not clear
Recent studies show This paper describes This paper presents
155832/1502/996
21130/61141/13754/789751/1401/99322129/1090/17922129/1090/232
约。上面论及的几个序列, 都是JDEST 中的显著搭配。表
2是关于它们的统计数据及其语篇功能。
Expected freq. Observed freq. Obser 1/Expe. Discourse functions Claiming centrality Questioning study
01015 010088 01000065 010027 01 25
329 3. 专业性搭配的类联接特点
清等, 1988:99) 间的结合。而是更高一级的抽象。米切尔(Mitchell , :-122) 认为, 类联接是关于词语组合类别的抽象表述, 搭配则是类联接的具体实现。换言之, 类联接是词语搭配发生于其中的语法结构和框架。一个类联接代表了一个类别的词语搭配, 可称为搭配类(col 2
locational class ) 。比如, N +V 就是一个类联接, 代表一类搭
(DET +) N 1+N 2+Nn +N 序列。这是专业性搭配的一大特点, 在其它语域的文本里较为少见。这种形式的组合被用来表达各种不同的专业意义与理念, 如:
1) 专业组织、机构或系统
the city commodity futures trading commission (城市商品期货贸易委员会) /01050KVA dry 2type control power transform 2
ers (01050千伏安干燥型控电变压器)
2) 专业人员
discourse community members (话语社团成员) /the corpo 2ration product development team (公司产品开发组)
3) 专业理念
the development process control evaluation (开发过程控制评估) /the microcomputer program development process (微型计算机程序开发过程)
配, 在研究中称之为N +V 搭配。“data shows ”、“evidence
suggests ”和“water evaporates ”等都是N +V 搭配的具体实
例。类联接多种多样, 有繁有简。a +N +of 也是一个类联接, 也代表一类搭配, a sort of 、a pair of 、a couple of 、a se 2
ries of 等是其具体实例。(Renouf and Sinclair , 1991:131-132)
类联接怎样界定, 繁简到什么程度, 要视具体的研究内容和目的而定。
专业性搭配的类联接有许多特点。这里择其最主要的特点加以讨论。
311(DET +) N 1+N 2+Nn +N 的类联接形式
这种由限定词和多个名词累加组成的搭配序列, 形式简洁, 意义明了, 交际效果直截了当, 是专业文本中词语组合的鲜明特点之一。
312 V 2ing 或V 2ed +N 的类联接形式
在专业文本中, 另一个大量使用的类联接是V 2ing 或
V 2ed 加名词的组合。这一搭配在普通英语文本中远不如专
在一般词语搭配的N +N 组合中, 第一个名词为修饰语, 第二个名词为中心词。然而在专业性搭配中, 名词词群不仅仅涉及两个名词的组合。在相当多的情况下, 修饰中心词的限定词和一连几个名词累加在一起共同修饰中心词, 由
2strengths increase gradually with 业文本中普遍。例如, 在JDEST 中, “increasing amount/s ”和“increased amount/s ”这两个搭配的实例极多。下面显示“increasing amount/s ”的4行词语索引:
1ecreasing green density signifies an increasing amount of internal surface area
increasing amount of deformation at high deforma of Japanese technology and aut 3rocket , NASDA gradually introduced an increasing amount
第4期卫乃兴 专业性搭配初探
313 使用表示具体意念名词的趋向
・23・
类似的搭配还有:“increasing cost (demand 、complexi 2
ty 、importance 、interest 、pressure ) ; increased cost (complexi 2ty 、demand 、efficiency 、levels 、risks 、use ) ”等。LOB 和Brown 语料库中也有“increasing ”和“increased ”与一些名词
专业性搭配的另一形式特点是常使用表示具体意念的名词。在普通英语中, 人们常用“by means of ”这个词组表达“方式”、“手段”、“方法”等意义。在专业文本中, “by
means of ”用的也很多, 然而在学术论文中描述“研究方法”
结合的实例, 但频数较低, 而在JDEST 中,V 2ing +N 或V 2ed
+N 类的组合比比皆是, 是学术研究人员表达意义的重要词
时, 研究者多用“by use of ”。这一搭配在JDEST 中的观察频数为49, 下面是其中4行词语索引:
by use of by use of 229.
[10]K jellmer , G. Some thoughts on collocational distinctiveness [A ].
In Corpus li nguistics :recent developments i n the use of com puter
corpora i n English language research [C ].eds. J. Aarts &W.
语手段, 无疑是专业性搭配的重要类联接之一。
2nes/cm during the course of an experiment 3ed a number of approaches to recover oil 1he helical spring ) ; and “fine control ” by use of the piezoelectric crystal tube , wh
the clamp -adjusting rod. The dista surfactants to reduce interfacial 从这些索引可以看出, “of ”一词右面的搭配词一般指具体的工具、事物、器械、图表等, 如“the piezoelectric
crystal tube ”、“the clamp 2adjusting rod ”、“surfactants ”等。
ni neties [C ].ed. S. Anivan. Singapore :RELC , 1990. 215-
类似“by use of ”的用法基本上是专业文本所特有的, 在普通英语文本中出现的实例极少。LOB 仅有两例且也是出现在科技文章中。
4. 结束语
Meijs. N. S :Costerus , 1984. 163-171.
[11]K jellmer , G. Aspects of English [A ].In Corpus li n 2
guistics and beyond [C ].Meijs. Amsterdam :Rodopi ,
专业性搭配是词语搭配的一个重要子类。研究专业性搭配可进一步丰富词语搭配研究的内容, 对描述科技文章中词语组合的特点与规律、其语义特点和语篇组织特点都有重要价值。本文以JDEST 。参考文献:
[1]刘润清等. 现代语言学名著选读(下册)
[M ].北京:测绘出
140.
[12], A of [A ].In English Corpus L i nguis 2
:t i n of Jan S vartvik [C].Eds. K. Aijmer &
London :Longman , 1991. 111-127.
]McCarthy , M. J. V ocabulary [M ].Oxford :Oxford University
Press , 1995.
[14]McIntosh , A. Patterns and Ranges [A ].In Patterns of L an 2
guage:Papers i n General , Descri ptive and A pplied L i nguistics
[C].eds. A. McIntosh and M. A. K. Halliday. Bloomington and London :Indiana University Press , 1967. 181-199.
[15]Mitchell , T. F. Pri nciples of Fi rthian li nguistics [M ].Lon 2
don :Longman , 1975.
[16]Renoulf , A. and Sinclair , J. Collocational Frameworks in English
[A ].In English Corpus L i nguistics :S t udies i n Honour of Jan
S vartvik [C ].eds. K. Aijmer &B. Altenberg. London :Long 2
版社, 1988.
[2]卫乃兴. 词语搭配的界定与研究体系[M ].上海:上海交通大
学出版社, 2001a. (待发)
[3]卫乃兴. 语料库证据支持的词语搭配研究[A ].杨惠中. 语料
库语言学导论[C].上海:上海外语教育出版社, 2001b. 发)
(待
[4]杨惠中. 语料库语言学导论[M ].上海:上海外语教育出版社,
2001. (待发)
[5]Firth , J. R. Papers i n li nguistics 1934-1951[M ].London :
Oxford University Press. 1957.
[6]Halliday , M. A. K. Lexis as a linguistic level [A ].In memory
of J. R. Fi rth [C].eds. C. E. Bazell , J. C. Catford , M. A.
man , 1991. 128-143.
[17]Sinclair , J. Beginning the study of lexis [A ].In memory of J.
R. Fi rth [C ].eds. C. E. Bazell , J. C. Catford , M. A. K.
Halliday &R. H. Robins. London :Longman , 1966. 410-430. [18]Sinclair , J. Collocation :A progress report [A ].In L anguage
Topics :Essays i n Honour of Michael Halli day [C ].eds. Steele ,
K. Halliday &R. H. Robins. London :Longman , 1966. 148-162.
[7]Halliday , M. A. K. A n Int roduction to Functional Gram mar
[M ].London :Adward Arnold. 1985.
[8]Jones , S. &Sinclair , J. English lexical collocations :a study in
computational linguistics [J ].(1974) :15-61.
[9]Kennedy , G. D. Collocations :Where grammar and vocabulary
teaching meet [A ].In L anguage teachi ng methodology f or the
Cahiers de L exicologie , 23. 2
R &Threadgold , Terry. Amsterdam :Benjamins. 1987. 319-331.
[19]Sinclair , J. Corpus , Concordance , Collocation [M ].Oxford :
Oxford University Press , 1991.
[20]Sinclair , J. The Search for Units of Meaning [J ].
(1996) :75-106
[21]Swales , J. Genre A nalysis [M ].Cambridge :Cambridge Univer 2
sity Press. 1990.
Text us IX
(责任编辑 严辰松)