汉语词语重叠结构统计分析
语言教学与研究2000年第1期
汉语词语重叠结构统计分析
邢红兵
) 词表中没有切分的重提要 本文以600万字的标注词性的语料库①(以下简称“语料库”
(1996年版修订本, 以下简称) 中收录的全部重叠结构为基叠结构和《现代汉语词典》《现汉》
础, 分析了汉语词语重叠结构的深层结构类型及产生方式, 文章还对可以重叠的各类词的主要
重叠形式进行了统计。文章得出的主要结论是:汉语重叠结构大部分是由一个词(重叠结构的
) 通过不同的重叠方式重叠而成的, 但也有相当数量的重叠结构没有基式。“基式”
一 引言
重叠是词语②的一种构造方式, 例如“妈妈”、“常常”、“轻轻”、“摇摇头”、“亮堂堂”、“实实在在”“、平平常常”“、许许多多”“、研究研究”等, 这些词语中至少有一个构成成分被使用两次或两次以上。我们知道, 汉语的主要重叠式有:AA式、ABB 式、AAB 式、AABB 式、ABAB 式、A
) 等。我们对各种重叠形式的内部结构进行分析里AB 式和AAA 式(例如“当当当”“、沙沙沙”发现:AA式包括三种, 一是音节重叠, 比如“猩猩、蝈蝈、蛐蛐”等, 这类结构属于单纯词; 二是
语素重叠, 比如“寥寥、绵绵”等; 三是词的重叠, 比如“妈妈”、“大大”、“慢慢”等《现汉》, 主要收录前两类AA 结构和部分第三类AA 结构。ABAB 式的内部结构比较简单, 这主要表现在他们的基式都是一个词, 如果从基式是不是一个独立的词这个角度来说,ABAB 式实际就是AA 式, 只不过“A ”代表的是一个双字词《现汉》, 和“语料库”中都没有收入。因此,AA 式和ABAB 式本文不做分析。
汉语的这些重叠结构的内部结构似乎用上述的AAB 、ABB 、AABB 等形式就可以形象地表示出来, 但是, 我们在进行分析的时候发现, 同样是AABB 结构, 它们的深层结构有显著的区别, 比如“:恭恭敬敬”是“恭敬”这个词通过语素重叠形成的“病病歪歪”, 是单音词“病”和“歪”仿照“恭敬”的方式构成的“, 花花绿绿”则是“花花”和“绿绿”直接构成的。重叠结构的内部构造和重叠结构的产生方式是本文分析的第一个内容。重叠结构一般都是由一个词重叠而成的, 例如“:妈妈”由“妈”重叠而成“, 平平常常”由“平常”重叠而成“, 研究研究”由“研究”重叠而成, 朱德熙先生把前者叫做“重叠式”, 后者叫做它的“基式”。但有一部分重叠结构并不是由一个词重叠而成, 而是由两个词重叠而成, 例如“白胖胖”、“歪歪倒倒”等, 他们不是由“白胖”和“歪倒”直接重叠而成的, 因而, 这些重叠结构实际上是没有基式的。对这两类重叠结构进行定量分析是本文的第二个内容。汉语中常见的是动词和形容词的重叠形式, 除此之外, 其他类词有没有重叠形式, 重叠的能力如何, 这是本文的第三个内容。
本文调查的重叠结构来自两个方面:(1) “语料库”中抽出全部没有切分的重叠形式; (2) 32
《现汉》中收录的全部重叠形式。下表是各类重叠结构在“语料库”和《现汉》中出现的次数。表中的“全部”包括:(1) 只在“语料库”中出现的重叠结构数量; (2) 只在《现汉》中出现的数量; (3) “语料库”和《现汉》都出现的数量。
表1 各类重叠结构数量表
ABB
AAB 643390
AABB 48386510
A 里AB 10110
AAA 909
语料库
全部
326206431
合计9263261050
我们统计到的重叠结构总数为1050个, 其中语料中使用了926个《现汉》, 中收录了326个, 有很大一部分没有被收入《现汉》中, 也有一部分《现汉》收录的重叠结构在语料中没有出现。本文主要分析这1050个重叠结构。
二 重叠结构的产生
重叠结构的产生方式可以从两个角度来考虑:(1) 重叠结构各个因素是如何重叠的; (2) 重叠结构是由什么因素重叠而成的。下面作具体分析。
2. 1全部重叠式和部分重叠式
从重叠结构的内部因素如何叠用的角度来看, 重叠结构可以分为两种情况:结构中每个因素都重叠, 例如“讨论讨论”“、干干净净”等; 结构中有部分因素重叠, 例如“黑压压”“、白胖胖”、“糊里糊涂”“、心心相印”等, 我们把这两种结构分别叫做全部重叠结构和部分重叠结构。
全部重叠结构包括:AA式、AABB 式、ABAB 式和AAA 式四种; 部分重叠结构包括:AAB式、ABB 式和A 里AB 式三种。从数量和能产性来看, 全部重叠结构在汉语重叠结构中占绝对优势, 因为AA 式、AABB 式和ABAB 式都是相当开放的, 大多数形容词和动词都可以有这样的重叠方式, 这方面的研究已经有很多成果, 本文不打算讨论。
2. 2有基式的重叠结构和无基式的重叠结构
从重叠结构各因素的来源看, 重叠结构的产生方式有两种:大多数重叠结构是单个词通过不同的重叠方式重叠而成的, 例如“看”和“看看”“、高”和“高高”“、大方”和“大大方方”等, 就是说重叠结构“大大方方”是由一个基式“大方”通过全部重叠的方式产生的; 另一类重叠结构并不是一个词重叠而成的, 例如“跌跌撞撞”不是“跌撞”直接重叠而成的, 是由“跌”和“撞”两个词重叠而成的, 这类结构实际上没有一个基式, 它们常常由两个语素直接重叠而成。我们把这两类重叠结构分别叫做“有基式的重叠结构”和“无基式的重叠结构”。
2. 2. 1重叠结构的内部构造
在分析有基式的重叠结构和无基式的重叠结构之前, 我们要分析的是各类重叠结构分别是由哪些成分通过什么方法产生的, 也就是它们的内部构造。比如“冷清清”“、乱糟糟”“、姨奶奶”和“红彤彤”都是ABB 式, 但是“, 冷清清”是由一个词“冷清”部分重叠而成“乱糟糟”, 是由两个词“乱”和“糟”部分重叠而成“, 姨奶奶”是由“姨”和重叠词“奶奶”构成, 也属于部分重叠形式“, 红彤彤”是由“红”加上生动形式“彤彤”构成, 可见, 他们的产生还是比较复杂的。我们对表1中的1050个重叠结构进行归类和分析, 分析结果如下(各小类的数量参见表3) :
(一) ABB 式
(1) ABB1:由一个双音节词AB 重叠而成, 它的重叠方式是只重叠第二个语素。例如:
33
哎呀呀哎哟哟当啷啷干巴巴咕咚咚咕嘟嘟咕噜噜轰隆隆哗啦啦滑溜溜空洞洞冷清清亮堂堂迷糊糊明亮亮年轻轻平滑滑平坦坦平展展水灵灵坦荡荡阴沉沉
(2) ABB2:这类重叠结构虽然和上面的结构相似, 但是它不是由一个词AB 通过重叠第二个语素而成,A 和B 实际上是两个意义相同或相近的单音节词。例如:
白亮亮白嫩嫩白胖胖恶狠狠光秃秃红艳艳黄灿灿紧绷绷泪汪汪冷冰冰凉冰冰亮晶晶亮闪闪乱糟糟圆鼓鼓胀鼓鼓直僵僵直挺挺
(3) ABB3:这类重叠结构包括两种形式, 一种是单音节形容词的生动形式, 是由一个单音节词形容词A 和一个双音节的重叠形式BB 构成的。其中B 的语素意义相对虚化, 这类结构是ABB3式的主要形式, 共287个, 占87%。例如:
矮敦敦白哗哗颤巍巍潮乎乎赤条条黑洞洞红朴朴厚敦敦灰溜溜假惺惺泪涟涟冷嗖嗖凉森森绿茵茵乱烘烘暖融融胖乎乎软绵绵傻呵呵乌溜溜
臭烘烘空荡荡满登登笑嘻嘻
顶呱呱辣乎乎慢腾腾硬梆梆
肥墩墩蓝盈盈毛绒绒脏兮兮
粉嘟嘟乐滋滋美滋滋皱巴巴
另一类ABB3结构是由一个单音节词A 和一个单音节词的重叠形式BB 构成的,BB 是可以单用的重叠词。例如:
蚕宝宝打喳喳嘀铃铃叮呤呤戈登登姑奶奶姑爷爷过家家黑猩猩乎啦啦脚窝窝哭咧咧老太太麻秆秆面团团挠痒痒扑拉拉噗啦啦沙窝窝少奶奶哇呀呀喜调调香饽饽洋娃娃姨姥姥姨太太圆圈圈 (二) AAB 式
(1) AAB1:这类重叠结构是由一个双音节词AB 通过部分重叠第一个语素而成, 这类重叠结构大部分是离合动词。例如:
摆摆手帮帮忙变变法变变样愤愤然过过秤过过风过过瘾
冰冰冷吃吃茶出出场点点头叮叮当哈哈腰惶惶然挥挥手记记账见见面
解解恨开开心开开眼聊聊天咧咧嘴努努嘴散散步散散心扬扬手摇摇头咬咬牙应应急悠悠然游游泳眨眨眼招招手吱吱声
(2) AAB2:这一部分重叠结构不是由一个词AB 通过部分重叠方式重叠而成的, 而是由一个AA 式词或AA 式的重叠结构加上B 构成的。例如:
代代花玳玳花嘎嘎叫刮刮叫呱呱叫哈哈镜浩浩乎芨芨草拉拉队拉拉蛄啦啦队溜溜转麻麻黑麻麻亮茫茫然毛毛雨蒙蒙亮懵懵然面面观囊囊膪泡泡纱泡泡糖飘飘然婆婆嘴悄悄话团团转娃娃亲娃娃生娃娃鱼碗碗腔欣欣然
(3) AAB2:这一部分重叠结构是由两个单音节词A 和B 通过部分重叠A 的方式重叠而成的。例如:
滴滴涕豁豁嘴急急风碰碰车碰碰船跷跷板觑觑眼 (三) AABB 式
(1) AABB1:这类重叠结构是由一个双音节词AB 通过分别重叠两个语素而成的。例如:安安静静缠缠绕绕迟迟疑疑叨叨咕咕地地道道端端正正工工整整和和气气哗哗啦啦健健康康磕磕碰碰唠唠叨叨凉凉快快溜溜达达34
冒冒失失蓬蓬松松飘飘洒洒平平静静普普通通清清白白热热乎乎时时刻刻舒舒展展踏踏实实歪歪斜斜潇潇洒洒絮絮叨叨摇摇晃晃
(2) AABB2:这类重叠结构是由两个AA 式词或AA 式的重叠结构直接合起来构成的, 它们的前后两部分是可以分开来单独使用的。例如:
白白胖胖风风火火孤孤零零轰轰烈烈红红绿绿花花绿绿叽叽喳喳家家户户静静悄悄空空荡荡慢慢悠悠密密麻麻木木呆呆婆婆妈妈曲曲弯弯堂堂正正稀稀落落嘻嘻哈哈星星点点幽幽淡淡郁郁葱葱
(3) AABB3:这类重叠结构是由两个单音节词A 和B 通过分别重叠后构成的, 它们的前后两部分是不能分开来单独使用的。例如:
病病歪歪病病殃殃颤颤微微颤颤巍巍吃吃喝喝出出进进粗粗黑黑大大小小荡荡悠悠跌跌撞撞断断续续方方正正肥肥瘦瘦疯疯颠颠疯疯癫癫高高矮矮沟沟岔岔沟沟坎坎哼哼哈哈荤荤素素急急慌慌口口声声你你我我三三两两深深浅浅早早晚晚真真假假祖祖辈辈 2. 2. 2有基式和无基式
从上面的结构分析我们可以看出, 有基式的重叠结构的基式有单音节词和双音节词两类, 它们又分别通过不同的重叠方式产生不同的重叠结构。
(1) 由单字词A 重叠为AA (看看) 、ABB3(矮墩墩) 、AAA (沙沙沙) 。
(2) 由双字词AB 重叠为ABB1、AAB1、AABB1、ABAB 、A 里AB 等。
无基式的重叠结构比有基式的要复杂一些, 具体包括以下几类:(1) 由单字词A 加上单字词B 构成的ABB2、AABB2、AAB3、A 里AB 。例如“恶狠狠”是由“恶”和“狠”“、跌跌撞撞”是由“跌”和“撞”“、碰碰船”是由“碰”和“船”两个词重叠而成的。(2) 由两个重叠形式AA 和BB 复合而成的AABB3(白白胖胖) , 例如“白白胖胖”是由“白白”和“胖胖”构成的。
(3) 由一个重叠形式AA 加上一个单音节词B 构成的AAB2, 例如“哈哈笑”。(4) 由一个单音节词A 加上一个重叠形式BB 构成的ABB3, 例如“姨奶奶”是由“姨”和“奶奶”构成的。
有基式的重叠结构是在一个词的基础上重叠而成, 基式和重叠式在意义上有一定的联系; 而无基式重叠结构没有基式, 是在两个词的基础上产生了一个新的词, 从这个意义上说, 前者是一种用词方式, 后者则是一种造词方式。因此《现汉》, 收录的重叠结构大部分是这一类。两类重叠结构的数量和类型参见表2。
表2 有基式和无基式重叠结构数量表
ABB1ABB2ABB3AAB1AAB2AAB3AABB1
AABB2AABB3900
860
AAA A 里AB 合计09
46
288767
无基式有基式
075
260
43287
051
325
70
0334
从上表可以看出, 无基式的重叠结构虽然在数量上要比有基式的重叠结构少, 但是它在各个结构类型中都有分布, 应该得到我们的重视。
三 各类词的重叠情况
汉语的各类实词几乎都有重叠结构, 其中动词和形容词的重叠结构最为常见, 部分名词、
35
像声词、副词、数词、量词、代词等也可以重叠, 我们对1050个重叠结构进行统计, 得出各类词的可重叠情况, 具体数据见表3、表4:
表3 各重叠结构的数量及在各类词中的分布表
ABB1ABB2ABB3AAB1AAB2AAB3AABB1
AABB2AABB[**************]0
[1**********]86
AAA A 里AB 合计000900009
9001000010
[***********]0
形容词
动词名词像声词量词副词数词叹词合计
[1**********]
[1**********]431
[**************]
[1**********]
[1**********]290
007000007
[**************]4
表4 各类词中有基式和无基式重叠结构分布表
有基式
无基式
形容词583142
动词10334
名词像声词24388124
量词
25
副词50
数词叹词4311
从上面两表的统计数据我们可以得出以下结论。除了AA 式和ABAB 式以外,ABB 式和AABB 式重叠结构是汉语的主要重叠方式。形容词、动词、名词和像声词的重叠能力较强, 重
叠的方式也比较全面, 这四类词的重叠结构占总重叠数量的98%。其中形容词的重叠方式以
) 可以有AAB 式的重叠形式。动词除了有ABB 式和AABB 式为主, 少数形容词(如“冰冰冷”AAB 式重叠结构外,AABB 式的重叠结构共84个, 占61%, 可见,AABB 式也是动词中除了AA 式和ABAB 式两种常见的重叠形式以外的一种很重要的重叠方式, 而且在有基式(如“哆) 和无基式(如) 两种情况下的数量都不少。名词重叠的主要方式是ABB 哆嗦嗦”“推推搡搡”
) 多于有基式(如式和AABB 式两种, 从有无基式的角度来说, 无基式(如“条条框框”“是是非) , 它们的比例为81∶非”24, 即77%的名词重叠结构是无基式的。像声词的重叠方式也是以ABB 式和AABB 式为主, 大部分的像声词重叠结构是有基式的。量词、副词、数词和叹词等虽
然有一些重叠结构, 但是数量很少, 而且重叠方式也比较单一。
四 结论
从本文的统计可以看出, 我们常说的重叠结构实际上包含有基式和无基式两种类型, 前者是在一个词的基础上重叠而成的, 这种重叠结构虽然在词形和意义上都有一定的变化, 但是基式和重叠式之间的关系是不可分割的, 从这个意义上说, 这类重叠结构是一种用词的方式。但是, 作为一种用词的方式, 它的能产性是有限的, 我们以双音节形容词的重叠情况为例, 据李大
(1978年版) 中的1738个双音形容词中可以按AABB 式重叠忠(1984) 统计《现代汉语词典》, 的只有300个, 占17. 3%, 因而绝对不能过分强调这类重叠结构的作用。无基式的重叠结构不是一个词重叠而成的, 而是由两个词重叠而成, 严格地说, 这类结构是由语素直接重叠而成, 因而这类结构实际上是一种造词方式。这类造词方式具有一定的能产性, 但是两个语素之间的关系又受到严格的限制。总之, 区分两类不同的重叠结构对汉语教学会有一定的帮助。36
附注
①本文使用的语料全部来源于北京语言文化大学语言信息处理研究所开发的现代汉语语料库。包括:(1)
1995年完成的“现代汉语语法研究语料库”; (2) 1998年与香港理工大学中文及双语学系建设的“现代汉语
语料库”; (3) 1999年与清华大学计算机系合作完成国家自然科学基金重点项目“语料库语言学研究的理论、方法和工具”子课题“汉语精加工语料库”等3个语料库, 共约600万字。②本文使用“词语”是为了避免重叠结构到底是词还是短语的争议。参考文献
陈光磊1994 《汉语词法论》, 学林出版社。
房玉清1991 汉语的重叠结构及其语义特征, 载《北京语言学院第五届科学报告会论文选》。胡明扬主编1996 《词类问题考察》, 北京语言学院出版社。胡裕树、范晓主编1996 《动词研究综述》, 山西高校联合出版社。
(2) , 北京大学出版社。李大忠1984 不能重叠的双音节形容词, 载《语法研究与探索》
李宇明1996 论词语重叠的意义《世界汉语教学》, 第1期。
(2) , 北京大学出版社。刘月华1984 动词重叠的表达功能及可重叠动词的范围, 载《语法研究与探索》(增订本) , 商务印书馆。吕叔湘1984 《汉语语法论文集》
俞士汶等1997 《现代汉语语法信息词典详解》, 清华大学出版社。朱德熙1997 《语法讲义》, 商务印书馆。
(邢红兵 100083 北京语言文化大学语言信息处理研究所)
(责任编辑 李清华)
北京大学王力语言学奖金第八届评奖工作顺利完成
北京大学王力语言学奖金评选委员会第八届评奖会议, 于1999年12月9日在北京大学中文系召开。会前, 评委们对全部申报材料进行了认真、细致的审阅。会议过程中, 评委们参照专家推荐书, 对每一位申报人的材料进行了深入的评议。评委会一致认为:评奖时不仅要看申请人著作的学术结论, 还要看他所使用的材料、方法以及由此所反映的学风、工力; 要对申请人的学术著作进行综合考察, 评定该著作对本学科的研究有无推动作用, 在本学科中是否处于前沿位置。评委会经过认真、充分的讨论, 一致通过:本届北京大学王力语言学奖金特等奖空缺, 一等奖一名, 二等奖四名。获奖论著及作者姓名如下。
(齐鲁书社) , 张鸿魁(山东省社会科学院) 。一等奖《:〈金瓶梅〉语音研究》
(中国文史出版社) , 傅爱兰(中央民族大学) 《汉语句法二等奖《普米语动词的语法范畴》:;
(安徽大学出版社) , 周国光(安徽师范大学) 《现代汉语的结构习得研究》; “N 的V ”与上古汉语(语文研究) 《(中国语文) , 姚振武(中国社会科学院) ; 的“N 之V ”》、先秦汉语受事主语句系统》
(语言研究) , 虞万里(上海辞书出版社) 。《三礼汉读异文及其古音系统》
(钟闻)
37