关于语言身份的识别问题
语言科学 /I S S N 1671-9484 C N 32-1687G 2013年9月
总第6 第12卷第5期(6期) 449-45语言新思考笔谈
‘ 本刊编辑部按在‘ 语言科学“ 创刊十周年之际, 语言科学“ 编辑部举办了 当代语言科学创新与发展国际学
, 术探讨会暨‘ 语言科学“ 创刊十周年学术庆典” 会议宣读的论文精彩纷呈, 本刊陆续选登了一部分, 还组织了
两期祝贺创刊十周年的笔谈, 但有的论文在匿名审稿过程中有不同的意见, 恰巧在此前后, 本刊陆续收到的一
些投稿论文在审稿过程中也有类似的情况, 审稿人有的认为这些文章非常精彩, 有的则表示难以赞同其观点, 也有的审稿人认为文章学术信息有一定的价值, 但对论文的写法有不同意见㊂ 编辑部经过认真讨论, 认为审
稿人的意见不同, 但都审慎有据, 值得敬佩; 同时认为这些论文在学术观点上也都有一定的原创性或借鉴性的
思考和研究实践, 学术上存在一些非共识, 是学术研究的自然现象, 应当给予鼓励和支持, 因此本刊特挑选出
这几篇探索思考性比较强的文章组成一组, 并仿照刊发笔谈的形式刊出, 名之为语言新思考笔谈㊂
关于语言身份的识别问题*
孙宏开
中国社会科学院民族学与人类学研究所 北京 100081
提要全球有多少种语言, 这是一个很难回答的问题㊂ 国际语言学界通常根据世界少数民族语文
研究院(出版的E 但该书在收录世界语言资料时缺S I L ) t h n o l o u e 提供的信息来确定语言的数量, g 乏一定的严肃性㊂ 主要是由于语言身份的鉴定在国际上缺乏一种学术界比较公认的科学的可以
量化的识别方法㊂ 文章围绕美国‘ 科学“ 杂志于2讨009年讨论中国语言识别问题的文章为引子,
论了语言身份鉴定过程中存在的一些问题, 反驳了该文对中国语言识别工作的一些污蔑不实之
词, 提出需建立一种互通度与语言结构差异度相结合的语言身份鉴定方法, 以引起讨论, 求得一种
国际语言学界都能够接受的语言身份识别的理论和方法㊂ 文章还认为在互通度标准以及技术在
实践中还没有能够取得学术界一致认可之前, 指派最终的语言代码是不成熟的做法㊂
关键词
中图分类号 H 2 文献标识码 A 文章编号 1671-9484(2013) 05-0449-11
[收稿日期]定稿日期]2013年3月29日 [2013年7月25日:/d o i 10. 7509. l i n s c i . 201307. 028360j *本文初稿完成后曾用电子邮件发送给语言学界同行和朋友征求意见, 先后有袁毓林㊁ 史有为㊁ 金立鑫㊁ 李佐丰㊁ 世界语言种类 语言身份鉴定 语言识别 语言与方言界限(以上名单以收到复函先后次序排列) 等2有的朋友还参加了反复讨论, 有的专家还打电话提出建0多位专家回了信,
议或进行讨论㊂ 现在根据专家们提出的意见做了初步修改㊂ 在此, 仅对关心并参与讨论的专家表示衷心的感谢㊂ 同时感谢‘ 语言科学“ 编辑部及匿名评审专家提出的宝贵修改意见㊂ 文章如有错误或不妥之处, 概由本人负责㊂ 田小琳㊁ 李宇明㊁ 王福堂㊁ 游汝杰㊁ 蒋绍愚㊁ 朱晓农㊁ 黄行㊁ 沈家煊㊁ 陆丙甫㊁ 刘丹青㊁ 石锋㊁ 王洪君㊁ 聂鸿音㊁ 罗自群㊁ 麦耘
449
语言科学 2013年9月
1引言
中国有多少种语言? 全世界有多少种语言? 这两个问题都很难回答㊂ 为什么? 这里涉及语言身份识别的标准和方法问题, 核心问题就是语言和方言的界限问题㊂ 近期, 该问题引起了境内外一些学者的
(‘ 广泛关注㊂ 事情起因是我1语言识别和民族“ 民族语文“ 第2期第9-1988年发表了一篇题为‘ 7页)
的文章, 讨论了中国少数民族语言身份的识别问题㊂ 这篇文章的主旨是回答中国究竟有多少种语言, 讨论了语言识别与民族的关系, 讨论了识别语言的复杂性和必要性, 提出了语言识别的标准, 按照谱系分类远近关系的原则, 文章附录列出了中国境内已经识别的120多种语言的名称及其谱系远近关系㊂ 该文引起了境外学者的关注, 被译成英文于1藏缅区域语言学“ 杂志上㊂ 992年刊登在美国加州大学的‘
2一封采访信
) 伊拉德(的采访信, 信中提出了1问题以及我的回答大致如下:M i c h a e lE r a r d 5个希望我回答的问题, 经过了许多年, 我收到由‘ 中国科学“ 杂志编辑转来美国‘ 科学“ 杂志专栏作家迈克尔㊃ 2008年冬,
问:您识别的第一种语言是什么? 这项研究是于何时何地做出的? 目前为止, 您一共识别了多少种语言? 答:我最早调查少数民族语言是在1那时候我在北京大学学习, 袁家骅老师带领我们记录侗953年,
语和水语㊂ 1我分配到中国科学院语言研究所工作, 开始自己到广西㊁ 云南㊁ 贵州调查954年毕业以后,
我的工作主要做新发现语言的识别工作, 我去云南省的中缅边境地区, 开展了1960年㊂ 其后, 1960年,
独龙语㊁ 怒苏语的调查, 在四川和云南开展了普米语㊁ 柔若语和阿侬语的调查, 去西藏1964年, 1976年, 中印边界东段开展了达让语㊁ 格曼语㊁ 义都语㊁ 门巴语㊁ 仓洛语等的调查, 四川开展了白1978年去甘肃㊁
马语的调查, 在四川和云南开展了嘉绒语㊁ 尔苏语㊁ 史兴语㊁ 扎巴语㊁ 木雅语㊁ 尔龚语㊁ 贵1979-1982年,
琼语的调查, 去四川开展了拉坞戎语调查㊂ 这些语言差不多都是最近调查发现, 并写出了初步1987年,
立项一起开展中国新发现语言的调查研究㊂ 有1逐个对一0多所高等院校和科研单位的老师与我一起, ‘ , 中国新发现语言研究丛书“ 已经有近60种语言列入计划开展调查研究㊂ 现在已经有38种语言的著作出版㊂ 在2009年将有10多种新的著作问世㊂
问:您现在仍然在进行田野调查吗? 如果是的话, 您在哪里进行田野调查?
答:是的㊂ 我几乎每年都会抽出一定时间开展少数民族语言田野调查, 不仅仅调查小语种, 也对藏语㊁ 彝语㊁ 傈僳语㊁ 纳西语等进行过调查㊂ 我的研究领域主要是藏缅语族语言, 调查的地区集中在西南几省㊂ 而且一旦开始记录具体语言, 往往在村寨以及比较边远的山区㊂
问:想向您了解, 在中国, 从事田野调查的最棒的语言学家们都是由哪些机构培训出的? 或者说, 接受了怎样的教育和培训背景?
答:一般由高等院校㊂ 那里有中国语言文学系㊁ 少数民族语言文学系或语言学系, 有专门训练记录语言的课程㊂ 有时为急需完成某个调查研究任务, 也采取办语言调查培训班, 用临时培训的方式㊂ 时间长的数月, 短的一两周㊂ 针对语言调查开设的课程有普通语言学㊁ 语法学㊁ 词汇学㊁ 语音学㊁ 语言调查实习等㊂
问:中国从事田野调查的语言学家们, 通常是在哪些地区进行田野调查? 或者说, 在中国哪些地区能够获取最多的新语言, 做出最多的语言识别工作?
450研究苗语和瑶语, 直到1研究所派我到四川调查研究羌语, 在那里, 我一直工作到956年㊂ 那年夏天, 的调查报告的㊂ 自1我开始组织我的同事, 在中国社会科学院和国家社会科学基金的支持下, 992年起, 些新发现的语言进行深入的调查研究, 每一种语言写出一部描写性著作, 由我和我的同事主编, 命名为
语言新思考笔谈
答:数十万人使用的语言一般不需要专门去识别, 我们现在识别的语言, 一般使用人口不多, 从几十人㊁ 几百人㊁ 几千人, 最多几万人, 往往分布在比较偏僻的地区, 或高山㊁ 或海岛㊁ 或边境㊁ 或人烟稀少的‘ , 语言学论丛“ 第3叫‘ 中国空白语言的田野调查“ 较详细地描述了新发现语言调查研究的情况㊂ 6辑上,
问:您认为中国总共存在多少种将会被识别的语言? 中国实际上总共存在多少种语言, 总数是多少? 集了1但是我们现在实际已经识别了1因为那本书的截稿时间是229种语言, 34种语言, 0世纪末㊂ 至于语言的数量, 我们和境外的学者在识别语言的观点和方法上有很大的分歧㊂ 我们比较严格, 境外比较松㊂ 这一点我在1992年的那篇文章中已经提到了识别语言的标准㊂ 这是我们区别语言和方言的基本标准, 不像境外的学者以是否能够听懂作依据㊂
问:我们非常想了解中国的语言学家在这方面作了哪些工作? 您可否给我们推荐一些其他的作相关研究的语言学家, 提供他们的联系方式, 我们想跟他们聊聊, 谢谢您㊂
答:在‘ 中国的语言“ 书里, 有近百位我同事的名字㊂ 我可以提供他们的联系方式, 但须得到其同意㊂ 言多样性的工作变得更为容易? 使语言学家的工作更为容易? 还是说, 使该工作变得更难了? 为什么?
答:中国是多民族多语言的国家, 语言多样性是社会的共识㊂ 但识别语言是一项学术性㊁ 政策性很强的工作, 需严肃认真地对待, 并不是很随意的工作, 我们也有一些语言, 如锦话, 过去有人认为他可能是一种独立的语言, 但经过比较研究, 确定他是佯黄语的一种方言㊂ 因此并不是语言识别得越多越好㊂
问:中国政府认为每一个民族都有可能有超过一种以上的语言㊂ 目前中国政府认为在中国一共存在有多少种正式的语言?
的使用两种, 还有的两种以上, 政府并不需要承认或确认它, 因为识别语言这是语言学界的事情㊂ 我在
语言识别与民族识别是既有联系, 又有区别的两件不同的事情㊂ 已经1992年的那篇文章中已经指出,
识别为独立语言的族群, 并不需要一定改变他的现族称不可㊂
问:中国政府说中国有5那么, 语言的数量是不是在中国也会被限制为一个固定的数? 6个民族,
答:请见上面的回答㊂
问:是否存在这样的现象:比如, 一些居民在一个地方聚居, 他们的语言已经被辨别出来了, 但是他们仍然想被列为一个单独的民族?
一些族群的语言被识别为独立语言, 但是他们要求自己成为一个新的民族的愿望并没有实现㊂ 国家在是否批准承认某个新的民族共同体的时候, 考虑到更多的复杂因素, 不单单根据是否是独立的语言㊂
问:在云南省, 还有什么人类语言学方面的未解的问题? 我们可以通过语言辨别工作协助解决吗? 答:中国云南是多民族多语言的省份, 人类语言学的情况非常复杂, 要解决的问题很多, 虽然我们已经作了很细致的工作, 但是还很难说已经完全解决, 而且已经识别出的语言, 仍然有需要不断深入调查研究的必要㊂ 例如, 境内已经识别的语言, 他们的历史地位如何? 在境外与哪些语言有关系, 他们的历史渊源如何? 远近程度如何? 也不排除还有新发现语言的可能性㊂
问:民族辨别话题是一个敏感的话题, 民族分类的历史沿革也很复杂㊂ 然而云南政府允许西方的语言学家在云南进行田野调查㊂ 为什么政府会允许西方研究人员在中国做这项工作?
451地区, 交通不发达, 生活不方便, 遇到的困难是很多的, 我最近发表过一篇文章, 刊登在北京大学主编的, 答:我和我的同事最近出版了一部由我主编的书‘ 中国的语言“ 由商务印书馆2该书收007年出版, 问:您在1992年发表的论文中着重说明了语言辨别工作的重要性㊂ 这是否使得此后在中国探讨语答:中国有5并不是每个民族都使用一种以上的语言㊂ 有许多民族仅仅使用1种语言, 有6个民族, 答:是的㊂ 在2我的语言识别工作是配合民族识别工作进行的, 后来0世纪70年代末至80年代初,
语言科学 2013年9月
基本政策是不会改变的㊂ 在这一总政策的指导下, 任何学术研究工作都可以参与, 但必须遵守中华人民共和国的法律, 在中国法律允许范围内开展工作, 包括语言识别工作㊂ 但您所提到的民族识别的工作,
, 中国政府早在2这当然是指大陆范围内) 也就是说不可0世纪80年代中期就已经宣布基本上完成了(
能再识别新的民族共同体㊂
问:在世界某些地区, 当地语言或民族语言是受到其本国保护的㊂ 中国语言学家是愿意和西方语言学家共同协作呢? 还是认为了解中国的语言情况是其内部事情, 从而不太希望和西方研究人员合作㊂
答:在回答上一个问题时我基本上已说明了这个问题㊂ 保护语言和开展语言研究的国际合作是并不矛盾的两件事, 实际上, 我们研究所和世界许多国家和地区已开展或正在开展少数民族80年代以来,
语言和汉语方言的合作研究, 取得了不少成果㊂ 我们希望把境外的语言学理论和方法介绍到中国, 我们更希望中国的语言学成果不断地介绍到国际上, 让国际语言学界更多了解中国语言学界所取得的成就㊂
问:您认为, 以及其他语言学家的工作是正确的么? 或者说, 他们的工作是在正轨B r a d l e P e l k e y , y , 上么? 还是剑走偏锋了?
答:早在20世纪80年代初期, B r a d l e r m 教授主持的澳大利亚国立大学与中国y 先生就参加了W u 社会科学院之间的合作项目‘ 中国语言地图集“ 的工作㊂ 因此他的工作我们基本上是肯定的㊂ 但是正如我前面指出的, 在语言识别的理论和方法上, 具体一点说就是标准上, 我们存在一些分歧, 他常常把中国学者确认为彝语方言或土语的地方话, 说成是独立的语言, 这个问题我曾经与他在瑞典隆德大学召开的一次国际汉藏语会议上讨论过㊂ 如果按照他的理论和方法来划分中国的语言, 恐怕就不止1而30多种, 是上千种㊂ 至于其他一些语言学家在中国的语言调查研究, 我并不完全了解, 很难一一加以评述㊂
问:一些在中国做研究的西方语言学家是由S 并且I L 资金提供赞助的, S I L 基金由基督教会设立, 答:中国自2实行改革开放政策, 欢迎境外的同行来中国开展合作研究, 这项0世纪70年代末以来, 他们的工作和‘ 圣经“ 的翻译者W y 与基督教传教士的联系并不会在语言学家的工c l i f f e 相关㊂ 很明显,
作中掺杂一些敏感的因素㊂ 为什么当地政府希望专家做语言辨别工作? 受S I L 基金资助的语言学家说些什么, 或者做些什么, 会给自己或工作带来麻烦?
答:我前面已经说过, 境外的语言学家, 包括S 在中国的一切活动, 必须在中国法律允许I L 的成员,
的范围之内㊂ S 早在2他们的各I L 组织及其分支机构, 0世纪80年代初就与中国语言学界有学术交流,
编辑并资助中国少数民族语言学术成果的90年代后期, S I L 的东亚部与我们研究所建立了合作关系,
出版, 合作举办一些培训班, 对促进中国少数民族语言研究事业的发展, 有一定积极作用㊂ 至于他们利用中国少数民族语言的研究成果, 回美国做翻译圣经的工作, 这是他们的事情㊂
1〕 科学“ 杂志的文章〔 3美国‘ 任领导都来中国访问过, 他们的语言调查研究理论和方法, 包括一些新的技术, 有许多值得借鉴的地方㊂
‘ 美国‘ 科学“ 杂志 新闻聚焦” 栏目(科学“ 刊登了迈克尔㊃ 伊2009年, 2009年第324卷第5925期)
拉德一篇关于中国语言识别的文章, 标题是:多少种语言? 语言学家在中国发现新语言㊂ 副标题是:在中国偏远地区工作的研究者发现了被深山深谷以及行政行为所遮蔽的数十种语言㊂ 全文如下:
退休的环境健康学教授卡里㊃ 舒克(在靠近中越边境的中国西南地区的大山深处结束C a r h o o k ) y S 了一天漫长的田野工作之后, 在自己入住的那家政府招待所遇到了另外一位美国人雅明㊃ 佩尔基〔 特此感谢㊂ 1〕 本文第三部分和第四部分由胡鸿雁博士翻译,
452
语言新思考笔谈
(, 感觉到非常惊讶㊂ 两个人开始互相寒暄起来㊂ J a m i nP e l k e y ) ) , ” 我正在采集虎甲虫(舒克解释道㊂ 你做什么的?” t i e rb e e t l e g
) 的研究生, 正在为博士论文写作进行田野调查㊂ 2佩尔基及妻子在云南省1t 006年, 0万平方公里范y 围内的4他们驾驶着一辆吉普车在崎岖的大山里行驶了11个村寨里收集语言材料㊂ 在一年的时间里,
万5千公里路程㊂ 最终, 佩尔基识别出了普拉族群(使用的2其中1P h u l a e t h n i c g r o u 4种语言, 8种以p ) 前从未进行过科学界定㊂ 直到佩尔基的调查识别工作之前, 这些语言都被视若无睹, 因为其使用者都被
彝族, 套上了同一个族群标签 官方认为所有彝族都使用同一种语言㊂
由于儿童不再学习㊁ 成人不再使用而导致数百种语言日趋消亡的这样一个时代, 许多现存语言从来
, 都没有得到命名(尽管这些语言不是 新” 语言, 特别是对于这些语言的使用者而言无 新” 可谈) 似乎很
让人感觉意外㊂ 然而, 语言学家说, 在中国㊁ 缅甸㊁ 亚马逊㊁ 以及其他一些地方可能存在数百种未经发现 ㊂ 佩尔基当时是澳大利亚拉筹伯大学(佩尔基的回答是:我在收集语言新品种” l aT r o b eU n i v e r s i -
(:的语言㊂ 佩尔基的2民族语:世界的语言“ 4种语言本月首次收录到最新版‘ E t h n o l o u e L a n u a e so f g g g , T ) 一书之中, 此书是总部位于得克萨斯州达拉斯市(的一家非营利组织世界少t h eW o r l d ) D a l l a s e x a s
‘ 民族语“ 一书收录了1包括来自1新” 语言㊂ 56个国家使用的6909种活语言, 9个国家的83种 ) 数民族语文院(编撰出版的一部权威性的㊁ 世界范围内的语言名录㊂ 这部最新版的S I LI n t e r n a t i o n a l
佩尔基新发现的语言就同一个国家发现而言是数量最多的㊂ 中国是 地球上还存在大量未经报道
, 和描写的语言的最后几个地区之一” 拉筹伯大学的语言学家戴维㊃ 布莱德雷说, 他也在云南工作㊂ 这
其中的原因涉及地理㊁ 历史㊁ 政治等诸多方面㊂ 布莱德雷推测, 仅在云南可能就有1西方和50多种语言, ) 中国的语言学者们正在对这一地区进行更为全面的普查㊂ 位于劳伦斯市(的堪萨斯大学的L a w r e n c e [语言学家阿丽恩㊃ 德怀尔说:在过去几年中, 中国人]十分关心自己国家的语言多样性, 十分渴望对母
㊂ 但是这种对于语言多样性的关注有时同多元一体的中华语保留问题进行研究, 并进行一些相关工作” ) 民族观(相抵触㊂ 位于加利福尼亚州帕洛阿尔托t h en o t i o no f am u l t i e t h n i cb u t u n i f i e dC h i n e s e s t a t e 的斯坦福大学历史学家托马斯㊃ 马拉尼(说 语言问题之所以特别敏感, 其原因在于T h o m a sM u l l a n e y ) ㊂ 在中国西南, 语言是进行人群(民族) 分类的主要方法”
语言归并
在一个地区怎么会有这么多种未发现语言呢? 一个原因就是这些村庄特别偏远㊂ 云南的山区非 ㊂ 但走进云南, 却发现只有几十种语言, 这是最让人惊诧的事情” ” 常多, 在共产党人开始修建道路之前交通非常不便, 许多族群在那儿繁衍生息了数百年, 佩尔基说㊂
云南的最常见识别特征就是非汉族族群色彩斑斓的刺绣服装以及纳缝的衬棉帽子㊂ 数千年来, 这些族群把云南的高山和低地称作家园㊂ 因为他们的语言几乎没有文字记录, 语言变化就没有受到任何制约㊂ 地方和朝廷政府对于语言大都漠不关心, 从来也没有普查过语言数量㊂
) 拉(的5两地之间的距离还不到8公A l oP h o l a 00名使用者听不懂另一种姐妹语言的使用者所说的话,
(, 里㊂ 佩尔基判断语言独立性的主要标准之一就是 互通度” 或者说就是不同语m u t u a l i n t e l l i i b i l i t g y ) 言变体的使用者在多大程度上可以互相听懂对方所说的话㊂ 在2互通度非常4种普拉语言的使用者中,
低㊂ 佩尔基说, 因此, 只要他们能够聚到一起, 他们就不得不用当地的官话交流㊂
许多中国的语言只是在现在才得到了某种程度上的描写, 因为把少数族群归并成几个大类的习惯做法掩盖了多样化的程度㊂ 2其0世纪30年代和40年代中国的社会科学家们精简了少数族群的数量,
453数百年的隔绝状态扩大了来自同一母语的各方言土语变体之间的差距㊂ 佩尔基说, 现在, 阿罗㊃ 坡
语言科学 2013年9月
大约520世纪50年代, 0名普查人员在云南花费了半年时间把两百万人口划分成了20个官方承认的
群体, 尽管所发现的族群名称多达2中国永久冻结了民族数量, 官方承认的民族共有512个㊂ 1991年, 6个:主体民族汉族加上5其中云南有2布莱德雷在‘ 语言社会学5个少数民族, 5个少数民族㊂ 2005年,
() 国际杂志“ 中写道, 直到2中国有I n t e r n a t i o n a l J o u r n a l o f t h eS o c i o l o fL a n u a e 0世纪80年代, g y o g g ㊂ 尽管方言一词方言” 55种以上的语言的说法还是被明令禁止的㊂ 任何增加的语言实体都只能归为
) ” , 地域方言(与语言, 或说独立自主的语言是相对立的㊂ t o o l e c t p ” , , 常常被翻译成英语的 但是, 更具体地来讲, 这个词是指 在一个特定地域使用的语言” 或者d i a l e c t
这种传统思维模式导致了中国和西方语言学者之间在语言界定这一问题上产生了一些分歧㊂ 北京
㊂ 孙1中国社会科学院的语言学家孙宏开说 我们比较严格, 境外比较松” 953年在四川省和云南开始进
行语言田野调查工作, 帮助识别了1他说9种语言㊂ 他倡导一种不同于西方语言学者的语言识别方法, 辨别语言和方言应该通过对语法结构㊁ 词汇和语音规律进行比较㊂ 如果这些方面类似, 这些变体就是同一种语言的方言㊂ 另一些中国学者进一步认为来自同一种共同母语并且拥有同一种文字系统的变体一定就是方言, 而非语言, 他们拒绝采用互通度标准, 认为其不科学㊂ 使用如上这些标准, 大约230种欧洲语言就会是有限几种语言的方言㊂ 中国语言学者 现在仍然局限于政治现状以及汉族主体强行把少数
, 布莱德雷说㊂ 民族归为几大族类的传统做法”
如在2一份有关濒危语言的报告中, 孙的清单上彝族只列008年给联合国教科文组织(U N E S C O ) ” , 主要依据是语言㊂ 这种做法的逻辑就是, 一个只有1马拉尼说㊂ 00人的族群对任何人都没有好处’ 了唯一的一种语言㊂ 尽管佩尔基描写的普拉语言中有些已濒危, 但因官方只承认彝族使用唯一一种语言, 这些语言作为濒危语言的情形就得不到认可㊂ 因此它们可能就很难得到有针对性的语言振兴资源㊂
到田野中去
获得了更大的自由, 可以把新发现语言识别为语言, 布莱德雷说㊂ 比如, 在孙的努力下, 帮助立1992年,
种, 而且在最后2而非方言㊂ 5年中识别的80种都叫做语言,
中国人对佩尔基等外国研究人员也采取了开放政策, 佩尔基是布莱德雷的学生㊂ 2佩尔基005年, 同样, 从2中国的语言多样性已经成为了一个公开的秘密, 中国的研究人员也0世纪80年代以来, 项了一项(中国社会科学院) 院级新发现语言项目㊂ 总的来讲, 中国的语言学者识别的语言总数为134
加入了世界少数民族语文院, 这家机构在描写少数民族语言领域中是规模最大的㊂ 世界少数民族语文院带有基督教传教目的:这家机构描写和分析语言, 以便有助于帮助进行‘ 圣经“ 翻译工作和识字计划㊂ 佩尔基说, 过去, 基督教组织在中国可能会遇到困难, 但是最近此类普查工作得到了支持鼓励, 因为这种工作帮助提供母语教育和协调语言振兴等工作㊂ 佩尔基以世界少数民族语文院成员的身份开展研究, 这家机构是2004年以来在云南注册的一家非政府组织㊂
佩尔基在云南的村寨中一次会待上3至5天, 调查10名左右当地人㊂ 他使用一个包括1200词的词表, 用汉语西南官话说出一个词, 并且出示这种物品的图片, 然后录下人们用自己语言说出的这个词㊂ 在调查间歇, 他录下人们所讲的故事, 播放给另外一个村寨的人听, 以便确定互通度㊂
, 语言都有声调, 都应该是主宾动语序(词汇结构非常简单㊂ 然而, 他发现尽管这些语言都有一个S O V )
对历史语言学来讲还是很新颖的语言距离矩阵(工具, 佩尔基判定阿扎和坡罗这两种ad i s t a n c em a t r i x ) 语言和其他2这两种语言即便用中国(学者) 的2种普拉语言从祖语中分化出来的时间比较久远㊂ 因而,
454最初, 佩尔基所做出的假设是, 使用普拉这个族称的人所使用的语言相互之间也是有联系的㊂ 这些远古祖语, 但并非很近的同胞手足关系, 甚至连关系较远的堂兄弟关系都不是㊂ 使用来自进化生物学㊁
语言新思考笔谈
评判标准而言也不是方言㊂ 所有这些语言的使用者都被归入了彝族㊂
语言学家说, 对有些社区的人而言, 他们欢迎对自己语言的描写和发现, 而对另外一些社区而言, 他们对于失去传统归属感觉到很不安㊂ 布莱德雷说, 在四川, 有20到25种语言的藏族使用者强烈反对任何否定他们是藏族的说法, 因此不愿把自己使用的语言识别为独立的语言㊂
(, ㊁ 为这些语言指派了识别码㊂ 这种语言编码在软件㊁ 数字文献(数位典藏) 图书馆I S O ) d i i t a l a r c h i v e g 藏书等中使用, 是对一种语言变体达到符合国际标准化组织的 语言” 定义的一种官方认可㊂ 现在还要
看中国政府会对这种认可会做出怎样的反应㊂ 马拉尼说, 人们开始谈论中国那儿存在新语言的时候,
㊂ 佩尔基希望因此而引发后续的争论㊂ 就会开始对民族数目是固定的这种观念引发思考” 你从假定的
” 这两者之间并非必须不一致, 也并非必须一致㊂ 此外, 定义语言引起了这么多争议, 而发现甲虫新品种就像是在公园散步一般了㊂ , 分类着手工作, 然后你在其中发现大量的多样性, 然后你用一种科学的方法来修正自己的观点” 他说㊂ ‘ 民族语“ 收录的2因为国际标准化组织4种新发现普拉语言现在国际上取得了某种官方地位,
4一封读者来信
讨论了一种具有重要性的挑战工作:精确界定语言的边界㊂ 我在联合国的多种族地区冲突预防332) p . 和解决行动工作时, 碰到过这个问题, 在那些地区成功地预防和解决冲突的关键取决于可靠的交流㊂ 孙宏开所描写的严格的标准构成了勾划语言边界的一种途径, 然而, 对于类似于我所从事的那种工作的实
互际应用目的而言, 一种语言或方言的使用者在多大程度上能够理解另一种语言或方言的使用者
构成了定义语言的终极测试㊂ 通度 , W. ) 上述文章发表后不久, 该杂志发表了一位读者沃尔特㊃ 希勒(的来信, 题目是:定义语S h e a r e r (, 言的边界㊂ 该来信说:新闻聚焦报道 多少种语言? 语言学家在中国发现新语言” E r a r d , M. 17A r i l p
然而遗憾的是, 确定互通度是非常复杂㊁ 艰巨的工作, 现在还没有普遍采用的测试互通度的技术㊂ 建立一种简单可靠的技术可以惠泽辨认语言边界的任务, 这种技术可以确定哪些地方需要我们努力进行确保跨越语言障碍交流的工作㊂ 在互通度标准以及技术在实践中还没有能够取得一致之前, 指派最终的语言代码是不成熟的做法㊂ 这一问题需要各国语言学家共同协作, 另外还需要必要的经费支持㊂ 5中国学者的一些观点
讨论了中国语言和方言问题㊂ 其后吕叔湘先生也讨论过区分语言和方言的标准㊂ 他在为‘ 中国大百科全书㊃ 语言文字“ 卷所写的卷首语‘ 语言和语言研究“ 一文的 语言与时间和空间” 一节里, 提到 标准语
㊂ 他说: 和方言” 有人的地方就有语言, 在地球上分布着很多很多的语言㊂ 常常听到有人问:世界上有多少种语言? 这个问题很难回答, 因为要分清楚这是几种语言, 那是一种语言里边的几种方言, 并不是一件很容易的事情㊂ 一般的说法是:完全不能通话的是两种语言, 基本上能够通话的是一种语言的两种方言㊂ 实际上这不能用来作为唯一的标准㊂ 如德语, 在联邦德国与荷兰交界的地方, 两边的居民基本上可以通话, 但他们说的话一个算是德语的方言, 一个算是荷兰语的方言㊂ 反之北德意志方言和南德意志高地的方言通话相当困难, 可是都算是德语方言㊂ 可见, 能否通话不能作为区别方言和语言的唯一标准, 还得加上一条, 有没有共同承认的标准语, 并且这标准语有统一的书面形式㊂ 有些外国学者的著作
” (里讲到汉语常常按上一个复数语尾, 这就是只承认前一条而忽视了后一条的结果㊂ 吕叔湘1988) 在我国, 较早讨论中国的语言与方言问题的是李方桂先生㊂ 1李先生在上海申报发表文章, 937年,
455
语言科学 2013年9月
不能不加讨论地把某两种话或几种话(仅仅因为它们被称为同一民族) 说成是同一语言的不同方言㊂ 总得有一定数量的词汇特别是一定百分比的基本词汇相同(不妨语音相差很远, 彼此互不通话, 但必须
, 还有语法构造的基本特点总应该是大致相同㊂ 换言之, 确定同一语能找出它们间的语音对应关系)
㊂ 他还认为: 言应该有其质的和量的规定性” 我们不能说, 既然民族成分已定, 那就得千方百计来 论
㊂ 不能对客观存在的事物采取随心所欲的解释㊂ 要根据我国的实际证’ 这个民族说的 就是一种语言’
” 情况来考虑问题㊂
胡明扬(认为 语言和方言主要不是结构语言学的概念而是社会语言学的概念㊂ 语言和方言1981) 王均(说, 诚然, 关于语言和方言的划分, 现在似乎很难说有一个什么统一的标准; 但我们总1981) 就其结构系统而言并无二致, 仅仅是社会身份有所不同而已㊂ 因此, 在确定是两种或几种不同的语言, 还是同一种语言的不同方言的时候, 首先要考虑的应该是社会政治因素, 当然也要从语言结构方面的因
㊂ 后来, 素去考虑㊂ 在多数情况下, 二者的结论是一致的, 但也有不一致的情况” 胡先生1语文991年在‘
, ㊂ 建设“ 发表了另一篇文章‘ 语言和方言“ 进一步阐述了他的学术观点(该文见胡明扬2011:454-460)
(㊂ 现将该文章摘要抄录如下: 为‘ 语言识别的语言学标准是什么?“ 徐世梁2不少西方学者认为中012)
并且得到了国际标准化组织的承认㊂ S 24种民族语言定义为独立的语言, h e a r e r 虽然认为互懂度是识
别语言的最终标准, 但指出测度互懂度的技术还不成熟㊂ 孙宏开此前结合中国境内语言和民族的复杂关系, 综合考虑语言结构和政治社会因素, 提出了在我国进行语言识别的原则和标准㊂ 与西方学者不同的是, 他非常重视分析㊁ 比较语言结构与周围语言之间同异在语言识别中的作用㊂ 互懂度实际上是以语言系统的差异大小为基础的, 必需落实到语言系统的比较才能充分发挥作用㊂ 现代语言已经在语言系统㊁ 语言与社会的关系等方面积累了丰富的成果, 至少可以为语言识别提供两个可以参考的标准:语言系统的异同和对语言社区的认同㊂ 语言识别工作有着重要的社会影响, 语言学家应当积极利用这些成
” 果, 立足于严谨㊁ 科学的研究, 推动有关 语言关系’ 问题的讨论㊂ 国语言学家在识别语言方面过于保守, 美国语言学家J a m i nP e l k e y 以互懂度为标准把他在云南描写的‘ 最近, 针对美国‘ 科学“ 杂志有关语言识别的文章, 云南民族大学学报“ 刊登了徐世梁的文章, 题目
6讨论
那么, 要不要确立语言身份? 如何识别一种语言为一个独立语言的身份? 在确立一种语言为独立语言身份的时候, 它与方言的界限是什么? 要不要建立识别语言区分语言和方言界限的方法? 用什么方法来鉴别一种独立语言的身份? 国际标准化组织根据什么原则确定独立语言的代码? 本节拟就这些问题展开讨论, 以求教于语言学界㊂
世界少数民族语文研究院(又称美国暑期语言学院, 其总部设在美国达拉斯, 该组织自21) S I L ) 0(:, 世纪5民族语:世界的语言“ 每隔数年出0年代以来开始编辑‘ E t h n o l o u e L a n u a e so f t h e W o r l d ) g g g 版一卷修订本, 至今已出版了1第1每种语言都有6次修订本, 6次修订本一共报道了全球6909种语言,
前面美国‘ 科学“ 杂志新闻聚焦栏目报道美国学者P e l k e 4种少数y 夫妇在中国云南省南部发现的2一个由国际标准化组织给配的语言代码㊂ 联合国教科文组织以及许多国际组织报道世界语言数量时, 基本上根据这本书为依据的㊂ 可见这是一项重要的事情, 是全球有多少种语言的一个非常严肃的数字㊂ 民族语言就是这本书报道的, 而且国际标准化组织给这24种语言配给了语言代码㊂ 但是事实情况是
中国组织了7个少数民族语言调P e l k e 4种语言是中国彝族使用的语言㊂ 20世纪50年代, y 报道的这2查工作队, 其中第四工作队有1是专门对彝语支开展调查研究, 经过两年左右实地记录, 00多人的队伍,
456
语言新思考笔谈
在彝族地区共收集了数百个调查点的资料, 在老一辈彝语专家陈士林先生的领导下, 数十位包括彝族语文工作者在内的专家学者进行了点与点之间的语音㊁ 语法和词汇比较研究, 在此基础上划分了彝语方言 , 语言” 全部都在彝语东南部方言26个土语之一的文西土语分布地区之内㊂ 而文西土语有8个支系, 个语言码, 使得世界的语言数量又增加了2这种极不严肃的做法, 已经引起读者的质疑, 我们有理4个, 土语㊂ 确定彝语划分为6大方言㊁ 这一学术观点一直沿用至今㊂ 而P 26个土语, e l k e 4个y 识别出来的2㊂ 语言” 属于文西土语 普拉” 支系的彝族使用的语言(陈士林等2P e l k e 009:121) y 识别的 在中国学者研究分析的一个地方土语之内, 识别出2而且国际标准化组织还配给一4种语言出来,
n o l o u e 公布的世界语言数量的准确性呢? g ‘ 互懂度㊁ 沟通度) 测试法, 科2) P e l k e y 等人识别语言的方法是国际一些学者通常使用的互通度(
学“ 杂志对他的方法有具体的描写㊂ 2世界少数民族语文研究院东亚部与云南省民族语言文000年秋,
字指导工作委员会联合在昆明举办过一周左右有关互通度测试的培训班, 我有幸自始至终参加了此项培训工作, 深知这种测试语言差异的方法便于量化, 易于操作, 但有一定的局限性, 缺点十分明显㊂ 首先, 测试对象的语言能力㊁ 文化水平㊁ 社会经历和智力都会影响测试结果, 经常出门和从来不出门的测试对象在理解语言的时候会有很大的差异; 智商高和智商低的对象在理解样本的时候也会有差异㊂ 其次是样本内容的选择, 词表的确定以及世俗样本和文学作品在测试过程中会使不同测试对象在理解测试内容的时候产生偏误和差异, 测试者的诱导有时候会影响测试结果㊂ 再次, 如何分析测试结果, 差异多少算独立的语言? 在国际标准化组织没有确定一种学术界公认的测试方法以前, 就确定配给语言代码
㊂ 的做法, 正如一位读者来信中指出的, 是 不成熟的做法”
我们对语言身份识别有一套比较适合中国国情的做法, 考虑到中国汉语和少数民族语言内部差异非常大, 几乎所有的语言都不同程度地存在着内部差异, 有的大, 有的小㊂ 仅仅采用互通度的方法无法解决中国语言与方言界限的建立㊂ 如仅仅按照P 中国的语言数量会成十倍甚至百e l k e y 互通度的做法,
倍的增加㊂ 以汉语为例, 汉语方言经过反复研究和论证, 确定划分方言大片和小片的做法, 共分10个大片9有的小片之间互通都有困难㊂ 难道要将汉语划为96个小片㊂ 如仅仅以互通度来测试, 6种语言不成? 因此我们在少数民族语言识别过程中, 既采用了语言互通度的方法, 也考虑划分和确立一种独立语言的政治和社会因素, 更重要的使用了比较语言结构差异的方法, 将多方面的因素结合起来来确定语言身份以及语言和方言之间的界限㊂ 至于互通度如何测试, 我们一般依靠本民族来做, 而不是语言学家来做㊂ 本民族对母语间的差异是最敏感的, 哪些语言能够通话, 通到这么程度, 他们心里都有一杆秤, 他们对语言内部的差异比较敏感, 一般一个语言内部存在方言或土语差异的, 一开始互通可能有困难, 但经过一段时间以后就会慢慢地沟通㊂ 但语言之间的差异, 必须通过系统学习才能够学会另一种语言㊂
我们识别语言以及划分方言土语的做法要比单纯依靠互懂度的测试方法严谨得多, 但它得到了‘ 科学“ 杂志以采访对象的语言加以否定㊂ 由怀疑它的科学性, 更怀疑国际标准化组织乱给语言代码的严肃性㊂ 这样一来, 人们还怎么相信E t h -
我们认为, 语言身份的确定应该采取区别对待的原则:已经确定为独立国家㊁ 民族㊁ 族群的共同体, 他们使用的母语, 不管他们与周围的国家㊁ 民族或族群的语言差异大小, 一律应该确定为独立的语言㊂ 否则, 完全按照沟通度标准来区分语言和方言, 那么许多欧洲一些国家的语言, 彼此基本上都能够沟通, 难道不把他们算作独立的国家语言吗?
进一步说, 在一个国家㊁ 民族或族群内部, 要识别出一个新的语言来, 一定要采用互通度与语言结构差异相结合的方法来定位, 不能够简单采取是否能够听得懂来判断㊂ 我们已经根据中国的情况确定了
457
语言科学 2013年9月
识别语言的一些大的原则, 并初步建立了一个社会因素与语言结构差异标准相结合的观察角度来区分语言和方言的界限, 这一点在‘ 中国的语言“ 第一编第二章里有进一步的分析㊂ 当然, 这个标准在实践中可以不断完善㊁ 补充和修订, 但是这个思路应该是肯定的㊂
美国‘ 科学“ 杂志刊登自由撰稿人迈克尔㊃ 伊拉德的文章, 虽然他在发表该文章以前采访了中国3) 学者, 但是他完全没有理采中国学者的观点㊂ 在他的文章里, 利用一些对中国情况一知半解的学者的语言, 做了一些不符合事实的报道和评论, 新闻聚焦栏目未经核实, 就刊登了出来, 这一做法违背了一个新闻工作者的职业操守㊂ 例如, 该文章中以下一些说法都是不正确的, 与事实有很大出入:
地方和朝廷政府对于语言大都漠不关心, 从来也没有普查过语言数量㊂ 中国语言学者 现在仍然局限于政治现状以及汉族主体强行把少数民族归为几大族类的传统 直到2中国有50世纪80年代, 5种以上的语言的说法还是被明令禁止的㊂ 任何增加的语言实 佩尔基的调查识别工作之前, 这些语言都被视若无睹, 因为其使用者都被套上了同一个族群标 佩尔基判定阿扎() ((使用人口5万3千人) 和坡罗(使用人口3万人) 这两种语言A z h a P h o l o )
在四川, 有2因此不愿把自0到25种语言的藏族使用者强烈反对任何否定他们是藏族的说法,
这种传统思维模式导致了中国和西方语言学者之间在语言界定这一问题上产生了一些分歧㊂ 我们无需逐项驳斥上述一些不符合中国实际情况的说法, 只要读者认真读一读我答复采访者的文字就一切都明白了㊂
语言身份识别是一项学术性㊁ 政策性㊁ 技术性都很强的工作, 学界至今没有一套比较科学的鉴定4) 标准和方法, 以至于目前公布的语言数字与实际情况出入很大, 可信度不高㊂ 这种状况亟待改进㊂
那篇文章在美国发表后, 先后应邀在美国宾夕法尼亚大学人类学系㊁ 加州大学语言学系㊁ 里海大学人类学系㊁ 荷兰莱顿大学汉学院㊁ 法国科学院东亚语言所㊁ 香港中文大学人类学系等就同一主题从不同角度做过讲演, 阐述我们对语言身份识别的看法, 与同行就这一主题广泛开展学术交流, 多数学者都有同一呼声, 应该尽快建立一个国际通用的语言识别标准㊂ 在学界对语言身份识别的观点和方法形成共识前, 最好尊重各国语言学家对本国语言识别的结果及数量的认可, 不要随便乱给代码, 以免引起不良后果㊂ 中国是多民族㊁ 多语种的国家, 在开展语言身份确定的工作中积累了一些粗浅的经验, 我1992年的 做法” ㊂ 体都只能归为 方言” 彝族, 签 官方认为所有彝族都使用同一种语言㊂ 和其他2这两种语言即便用中国(学者) 的评判2种普拉语言从祖语中分化出来的时间比较久远㊂ 因而, 标准而言也不是方言㊂ 己使用的语言识别为独立的语言㊂ 参考文献
, ‘ (, 陈士林 李秀清 边仕民 2彝语简志“ 中国少数民族语言简志丛书“ 修订版) 北京:民族出版社㊂ 009 ‘ 1-168页,
‘ 胡明扬 1语言研究“ 创刊号, 981 现代语言学的发展趋势, 1-7页㊂
(, 胡明扬 2胡明扬语言学论文集“ 增订本) 北京:商务印书馆㊂ 011 ‘
458‘ 吕叔湘 1中国大百科全书㊃ 语言文字“ 卷, 北京:中国大百科全书出版社㊂ 988 语言与时间和空间, 2-3页,
语言新思考笔谈
‘ 孙宏开 1民族语文“ 第2期, 988 语言识别与民族, 9-17页㊂
‘ 孙宏开 2语言文字应用“ 第3期, 005 用科学的眼光看待我国的语言识别问题, 26-28页㊂
, 孙宏开 胡增益 黄 行 2中国的语言“ 北京:商务印书馆㊂ 007 ‘ 孙宏开 2载‘ 语言学论丛“ 第3北京:商务印书馆㊂ 006 中国空白语言的田野调查, 6辑, 30-41页,
‘ 王 均 1民族语文“ 第1期, 981 民族语文工作中若干认识问题, 1-7页㊂
, M. ) , , :L e w i s P . 2009. E t h n o l o u e :L a n u a e s o h eW o r l d (16t hE d i t i o n D a l l a s T e x a s S I LI n t e r n a t i o n a l&th eU n i g g g f t - , W. , , S h e a r e r 2009. D e f i n i n a n u a eb o u n d a r i e s S c i e n c e 325(5942) 813. g l g g
(, 2) 1-19. T r a n s l a t e db a n d a P o l l a . y R y L v e r s i t fT e x a s . y o , S u nH o n k a i 1992. O nn a t i o n a l i t n dr e c o n i t i o no fT i b e t o B u r m a n l a n u a e s L i n u i s t i c s o i b e t o - B u r m a nA r e a 15g y a g g g g f T - ? L , , E r a r d , M. 2009. H o w m a n a n u a e s i n u i s t sd i s c o v e rn e wt o n u e s i nC h i n a S c i e n c e 324(5925) 332-333. y l g g g g 有关 ‘ 徐世梁 2语言关系” 问题的讨论, 云南民族大学学报“ 第4期, 012 语言识别的语言学标准是什么? 152-155页㊂
作者简介
孙宏开, 男, 现任中国社会科学院荣誉学部委员, 民族学与人类学研究所研究员, 中国民族1954年毕业于北京大学,
语言学会名誉会长, 美国语言学会名誉会员等㊂
O nD e t e r m i n i n a n u a e I d e n t i t g L g g y
S u nH o n k a i g
B e i i n 00081j g 1T h e I n s t i t u t e o t h n o l o n dA n t h r o o l o C h i n e s eA c a d e m o c i a lS c i e n c e s , f E g y a p g y , y o f S
t h a t a s c i e n t i f i c a n d q u a n t i f i a b l e i d e n t i f i n e a n sb o mm o nc o n s e n t i nt h e i n t e r n a t i o n a l a c a d e m i c y g m y c , c i r c l e i s s t i l l u n a v a i l a b l e r e a r d i n l a n u a e i n d e n t i f i c a t i o n . A s a s t a r t i n o i n t w e d i s c u s s a na r t i c l e g g g g gp u b l i s h e d i n t h eA m e r i c a n o u r n a l S c i e n c e i n 2009o n t h e i d e n t i f i c a t i o no f C h i n e s e l a n u a e s a n d s o m e p j g g ’ c e r t a i n s e r i o u s n e s s i n c o l l e c t i n i n f o r m a t i o no n t h ew o r l d s l a n u a e s . T h i s i sm a i n l u e t o t h e f a c t g g g y d ’ , c o r d i n o t h e i n f o r m a t i o n p u b l i s h e d i nS I L I n t e r n a t i o n a l sE t h n o l o u e . T h i s b o o k , h o w e v e r l a c k s a g t g ’ T h e i n t e r n a t i o n a l l i n u i s t i c s c o mm u n i t s u a l l e t e r m i n e s t h en u m b e r o f t h ew o r l d s l a n u a e s a c g y u y d g g - A b s t r a c t T h e q u e s t i o no f h o w m a n l a n u a e s t h e r e a r e i n t h ew o r l d i s v e r i f f i c u l t t o a n s w e r . y g g y d r o b l e m s i n t h e p r o c e s so f l a n u a e i d e n t i f i c a t i o n .W ea l s or e f u t es o m e f a l s es t a t e m e n t so nC h i n e s e p g g , l a n u a e i d e n t i f i c a t i o nw o r k f o u n d i n t h eA m e r i c a n o u r n a l S c i e n c e . F i n a l l i n o r d e r t o s t a r t a d i s c u s g g j y - s i o na n d t od e v e l o t h e o r n dm e a n s f o r l a n u a e i d e n t i f i c a t i o na c c e t a b l e t o t h e i n t e r n a t i o n a l l i n p a y a g g p - , u i s t i c s c o mm u n i t w e p r o o s eam e t h o d f o r i d e n t i f i n n dd i s t i n u i s h i n a n u a e sb a s e do nd e g y p y g a g g l g g - r e e o fm u t u a l i n t e l l i i b i l i t n ds t r u c t u r a l s i m i l a r i t .W eh o l dt h a t i t i s p r e m a t u r e t oa l a n g g y a y p p y a l - a r e f u l l c c e t e db h e a c a d e m i c c o mm u n i t . y a p y t y
b o u n d a r e t w e e n l a n u a e a n dd i a l e c t y b g g u a e c o d e a s i n t r o d u c e d b t h e S I Lb e f o r e t h e c r i t e r i a o nm u t u a l i n t e l l i i b i l i t n d r e l e v a n t t e c h n i u e s g g y g y a q K e w o r d s w o r l d w i d e l a n u a e t o l o l a n u a e i d e n t i f i c a t i o n l a n u a ed i f f e r e n t i a t i o n t h e g g y p g y g g g g y
459