人类语言基本元音体系的多样性分析
ª
COM. on C. A. 2:e7, 2008
现代人类学通讯 第二卷 2008年 Communication on Contemporary Anthropology Vol. 2 研究报告
人类语言基本元音体系的多样性分析
李辉
复旦大学生命科学学院现代人类学教育部重点实验室,上海 200433; 耶鲁大学医学院遗传学系人类多态性研究实验室,美国 康州 新港 06520
摘要:人类语言的各类音素中,元音相对比较简单,在全世界语种间的多样性也比较容易分析。本文收集了世界主要语系的621种语言和方言的元音体系,分析了基本元音总量和元音音系类型的多样性分布。基本元音总量在世界语言中从2到20不等,其地理分布很不均衡,体现为欧亚大陆的语言基本元音总量整体偏大,其中日耳曼语和吴语最大,而美洲和澳洲则整体偏小。通过把音素转化为数字,世界语言的元音音系多样性可以用遗传学中线粒体多态性的网络结构分析方法。网络结构分析发现,最常见的aeiou 的五元音音系类型可能是人类语言最原始的元音音系,处于网络结构的唯一扩散中心。其他音系类型可能都是从五元音音系经历不同的过程演化而成的。语音数字化对于语言学的统计分析有启发意义。 关键词:元音;多样性;网络结构分析;地理分布
Diversity Analyses on the Basic Vowel Qualities among the human languages
LI Hui
MOE Key Laboratory of Contemporary Anthropology, School of Life Sciences, Fudan University, Shanghai 200433 China;
Laboratory for Human Polymorphism Studies, Department of Genetics, School of Medicine, Yale University, New Haven CT06520 USA
ABSTRACT: Among the phonemes of human languages, vowels are much simpler than consonents and tones in structure, and therefore providing convenience of diversity analyses. Here basic vowel qualities of 621 languages/dialects were collected from the major linguistic families in the world. The basic vowel quality inventories vary from 2 to 20, and distributed unequally among the geographic regions. In the mass, the vowel inventories are mostly high in Eurasia and low in the Americas and Australia. The Germanic languages and Wu Chinese dialects have the highest vowel quality inventories. After digitizing the vowel qualities, the diversity of vowel quality systems of the world languages was analyzed by the method of NETWORK, which is usually applied to the mitochondrial DNA diversity in genetics. The network of the world vowel systems exhibits a single center expansion pattern, with the most common five-vowel system (aeiou) in the center, indicating that five-vowel system might be the most original vowel system of human languages. Different ways of complication or simplification from the five-vowel system might have resulted in the other types of vowel systems. The digitization of the phonemes will help in developing the field of linguistic statistics.
Key words: Vowel; Diversity; NETWORK analysis; Geographic distribution
语言是人类群体最重要的区别性特征之一。一直以来,语言学的分析和研究多是属于社会科学的范畴。然而,群体的许多语言学特征并不或者很少随着群体的主观意愿而发生变化。特别是语音系统的演化,往往是一种客观的自然的过程,相关的研究更应当归于自然科学的范畴。以自然科学的研究方法和分析手段处理语音系统等语言学特征或许能够更好地再现人类语言的演化过程。通过仪器测量声谱来分析语音的本质可以算是语言学中最具有自然科学研究性质的方面
收稿日期:2008年11月24日 修回日期:2008年11月27日
[1]。通过计算机对有关文本的词汇出现频率进行统计分析,也是一种典型的自然科学的分析方式[2]。实际上,语言作为人类群体的一项特征,在许多方面都适合使用群体遗传学的一些理论和方法进行分析。本文就是尝试用线粒体DNA 多样性分析的网络结构方法[3]来分析世界各种语言的基本元音系统的演变规律。
各种人类口头语言的语音系统一般包括辅音、元音和声调。辅音系统音位最复杂,多样性最丰富,语言之间比较的难度相对较 联系人:李辉[email protected]
李辉:人类语言基本元音体系的多样性分析 高。声调虽然是发音时必然出现的,但是只在部分语言中有识别意义。世界上大部分语言的音调并不会构成固定的语义差异,那些语言被认为是无声调语言。同时,声调在语种之间的多样性并不高,大部分有声调语言只区分高低两调,声调最多的侗语有15个声调。同时不同语种之间的声调相对缺乏可比性,使得声调多样性的分析也相对较难。一般来说,元音是音节的核心(辅音中鼻音、边流音和闪音有时也可成为音节核心) ,每种语言都会或多或少识别不同的元音音位。元音因为其声学性质的限制,种类没有辅音那样丰富。元音音位有明确的辨认方式[4],在不同语言之间比较也相对容易实现。因而本文以元音系统作为多样性分析的范例。
元音分为舌面元音和舌尖元音。在国际语音学协会(IPA)规范的国际音标中有28个基本的舌面元音[4]。舌尖音一般出现在汉藏语中,常见的有三个(图1) 。目前研究看来,没有一种语言可以识别所有28个舌面元音。实际上,各种语言在使用的时候,元音常常
研究报告
在各种情境下产生音变,音质向其相邻的元音靠近。单元音在合成双元音时音质常常会变化,比如汉语普通话中[o]和[u]合成[oʊ],但是普通话中并不区分识别[u]和[ʊ],这两个音都被识别为[u]。另外长元音、元音和谐、甚至语气语调的变化都可能造成元音的音变,但是往往在语言中没有区分识别的意义。这样形成的某种语言中的不具有识别意义的各类元音音变的音位不属于该语言的基本元音音位,本文统计的是各种语言中具有区分识别意义的各种基本元音音位。
很多学者认为,有声调语言是从无声调语言发展而来的,并且大部分都经历了由简入繁的过程,少数语言也有声调简化的过程[5]。海南岛三亚的占语就是典型的例子,越南南部的占语没有声调,迁移到海南岛经历了千年的演化后变成了典型的有声调语言[6]。有些学者认为元音也可能经历了与声调一样的演化过程。亚兰文字(Aramaic)及其衍生的古代阿拉伯文字、古代希伯来文字都只标注辅音而不标注元音,属于辅音音素文字
图1 元音音谱图以及元音的数字化转换。每一个元音可以转换成一个三位数字,百位为圆唇程度,十位为前元音与后元音的相对位置,个位为闭口程度(元音高度) 。
Fig.1 The vowel map and digitization of the vowels. Each vowel can be transformed into a three-digital number. The first digital stands for the roundedness of the vowel, second for the backness, and third for the height (closeness).
COM. on C. A. 2:e7, 2008
(abjad)[7]。这可能暗示着原始亚非语系语言可能并不区分元音,或者基本不区分元音。实际上,现代标准阿拉伯语也只有三个基本元音(iau),只区分了低元音、高前元音和高后元音[8]。有些现代语言只把元音区分为高低两类(aə)[9],实际上与无声调语言的轻重两种音节或者高低两种音调的划分非常相似,基本上可以认为是“无元音”语言。“无元音”语言究竟是语言的一种原始特征还是一种退化特征,人类语言的元音系统有什么演化规律,一种语言的元音系统可以达到何种复杂
程度,这些都是本文通过对人类语言元音多样性的统计分析试图解答的问题。
一、材料和方法
1. 语言材料的收集
从各种语言的音系调查报告、语言学教材、语言词典、地方志书等文献材料中收集到了全世界的621种语言和方言的基本元音体系资料(附表1) 。包括了全世界的各种主要的语系,其中印欧语和汉藏语的资料最为丰富(表1) 。
表1 世界各语系的不同基本元音总量的语种数和代表语种
Table 1 Language numbers of the different basic vowel quality inventories and language example of each linguistic family
(Super/Sub) FAMILY 语群 Niger-Congo Nilo-Saharan Afro-Asiatic
Basic Vowel Quality Inventory 基本元音音位总量 Language example 语言范例 2 3 4 5 6 7 [***********]Language Inventory Vowel Qualities
9 2 12 2221Yoruba 7 ieɛa ɔou
1 32Maasai 9 iɪe ɛa ɔo ʊu
1 6 6 7 6 1Hebrew 5 ieaou
Egyptian Arabic 5 ieɑou
Basque 1 1 Basque 5 ieaou Burushaski 1 Burushaski 5 ieaou Caucasians 2 1 3 3 1 111Georgian 5 iɛɑɔu Dravidian 2 1 1Tamil 5 ieaou Indo-European,general 1 1 15 16 8 955312Latin 5 ieaou
Italian 8 ieɛa əɔou
Indo-European,Germanic 1 1212232English 13 iɪe ɛɜæɑʌəɒɔʊu Andamanese 1 1 Ongan 6 ieaəou Australians 1 23 4 6 2 1 1Sydney 3 iau Papuans 1 1 9 4 2 1Naasioi 5 ieaou Daic 1 1 61Thai 9 ieɛa ɤɯɔou Taiwanic 1 3 Atayal 6 ieaəou Malayo-Polynesian 9 5 32 9 7 221Tagalog 5 iɛaou Austro-Asiatic 1 111Vietnamese 9 iɨe ɛa əɔou Hmong-Mien 1 1White Hmong 6 iɨea ɔu Tibeto-Burman 3 2 1 111Tibetan 8 ieɛaøouy Chinese,general 3 57121Manderin,Standard 10 ɿʅi ɛɑɤəouy Chinese,Wu [1**********]1Wu,Pinghu 13 ɿie ɛa ɯəɔøouyɥYenisian 1 Ket 7 iɨɛa əɔu Uralic 4 2 233Hungarian 7 ieaøouy Altaic,general 2 4 125211Altay 8 ieaɯøouy Altaic,Islander 3 1 1Japanese 5 ieaou Palaesiberian 1 Nivkh 6 ɪeæɤou Chukchi-Kamchatkan 3 Chukchi 5 ieaou Eskimo-Aleut 3 1 Inuit 3 iau Na-Dene 7 3 6 2 1Navajo 4 iɛao Algonquian-Wakashan 7 11 6 7 1 1Massachusett 4 iaəu Macro-Siouan 1 5 8 1 Lakota 5 ieaou Penutian 1 2 4 1 Maidu 6 iɨeaou Aztec-Tanoan 2 6 10 Shoshone 5 iɨaou Chibchan-Paezan 1 2 2 2 1 Uw Cuwa 5 ieaou Hokan 3 4 1 Pomo 5 ieaou Oto-Manguean 1 1 11Amuzgo 7 ieɛɑɔou Muskogean 4 Creek 3 iao Mayan 1 4 2 Mam 5 ieaou Arawakan 2 1 3 Wayuu 6 iɛa ɯɔu Ge-Pano-Cariban 3 5 1 1Guaraní 6 iɨeaou Quechumaran 2 Quechua 3 iau Andean 1 1 Arabela 5 iɪaou Amerind, others 1 3 7 1 Total 3 58 51 145 112 59 [***********]21 Frequency (%) 0.5 9.3 8.2 23.3 18.0 9.5 6.9 6.3 5.3 3.4 2.7 3.1 1.6 1.3 0.3 0.2
李辉:人类语言基本元音体系的多样性分析
研究报告
2. 元音音位的数字化方法
为了适应有关软件的数据格式,各种元音音素都被转化成了数字。本文中主要使用了网络结构(NETWORK)分析[3],所以每一个元音音素都转化成了一个三位数字(图1) ,与线粒体的突变位点格式一致。其中百位数代表圆唇和非圆唇的区别,以非圆唇为1,半圆唇为2,圆唇为3;十位数代表前后元音的区别,从前到后分了5个等级;个位数代表元音的高度(开口和闭口的区别) ,舌面音从低到高分为7个等级,舌尖音设定为第8级。百位数、十位数和个位数的确定是根据元音转变的难易程度而定的。圆唇音和非圆唇音之间相对最难发生转变,所以设置在百位上。 3. 元音总量的多样性分析方法
各种语言的基本元音总量差异较大[10],本文统计了各个语系的不同元音总量的语种数,用简单的数据列表进行比较,并且在世界地图上用饼状比例图显示其地理分布。 4. 元音音位的网络结构分析方法
把各个语种的元音音位数字化以后,用NETWORK 软件[3]构画不同类型元音系统的网络结构。网络结构分为两类,全世界总
体的结构和不同地理区域内部的结构。在网络结构中用不同比例的色调区别不同的语系、语族或方言区。
二、结果
1. 基本元音总量在世界各语种之间的差异
在表1中统计了36类语群(超语系、语系、语族或方言区) 的各种基本元音总量的语种数。本文统计的语言的基本元音总量从2到20不等,其中大部分语言的基本元音总量为5或6,占所有语种材料的41.4%。这提示5元音或在其基础上加上一个弱元音[ə]可能是人类语言中最自然的状态。拉丁字母中的5个元音(aeiou)也正是这种自然状态的反映。随着元音总量的增多或减少,相应的语言种类越来越少,其分布基本是较为平缓的单峰。如果剔除了元音系统最复杂的日耳曼语群和吴语群,其分布基本是正态的(图2) 。
由于不同调查者对语音的识别能力和理解方式都可能不同,个别语种的基本元音总量可能存在一定偏差,但是就本文大规模的语言统计而言,这种过高或过低的偏差会在统计中彼此抵消。比如中央元音[ə]常常会被
图2 世界各语种基本元音总量的数据分布
Fig.2 Data distribution of the basic vowel quality inventories of the world languages
COM. on C. A. 2:e7, 2008
认为是一种弱化的元音,在有些语言中仅仅是非重音或无调音而不一定是中央元音[11]。这个元音往往会被认为是[a]等元音的弱化而被忽略。这种情况下,阿布哈兹语(Abkhaz)就只有[a]一个元音了,[a]和[ə]只是音节轻重的差别,而不具有元音音位的识别意义[9]。所以阿布哈兹语几乎可以算是“无元音”语言。
印欧语系中的日耳曼语族和汉藏语系中的吴语方言群的基本元音总量都向最大化方向发展。日耳曼语族中,瑞典语和丹麦语的基本元音总量都达到了16,瑞典语甚至开始发展出声调[12],提示元音系统的复杂化可能与声调的形成有协同进化的关系。吴语是汉语中的一种语音系统最为特殊的方言群[13]。单元音化的过程使得吴语的基本元音总量大大增加,其中许多方言都达到了15左右。世界上目前发现的基本元音总量最大的语言是吴语的奉贤金汇方言,由于入声声调的退化,原来与入声声调对应的元音变音音位得到了加强和固定,以至于基本元音总量达到了20[14]。如果基本元音总量继续增加的话,很可能会给人耳的语音识别带来困难。 2. 元音总量多样性的地理分布
为了便于观察语言的基本元音总量在地理分布上的规律,图3中把各个语系的不同元音总量的语种比例饼图标注到世界地图上的相应位置。图中对基本元音总量的分级比以往的同类分析[10]更细,更容易体现规律。在地理分布上,元音总量体现出非常明显的不均衡性。基本元音总量较小的语种大量出现在美洲和澳洲,这些地区的一些语言只有3个基本元音甚至更少。基本元音总量较大的语种大量出现欧亚大陆,特别是印欧语系、汉藏语系和阿尔泰语系中出现了基本元音总量极大的语种。非洲撒哈拉以南的语种元音总量都处于中等水平。尤其值得关注的是南非古老的科伊桑语系,其中的各语种基本元
音几乎没有任何变异,维持在aeiou 的5元音状态,而它们的辅音系统却进化得极为复杂[15]。
3. 世界语言元音系统的网络结构
根据各种语言的基本元音音系的相似程度,把各语种由远到近排列起来,就可以形成一张复杂的关系网络。图4就是通过网络结构的分析来体现世界各语种元音音系的相似度。在图4中,每一个饼形都代表一种基本元音音系类型,饼形大小与这种音系类型所包括的语种数量成正比。饼形之间的线条长度与相应的音系类型的差异基本成正比。整个网络结构基本呈现一种单中心扩张的形状,扩张的中心是最普遍的aeiou 五元音类型。这种典型的扩张形网络结构的中心往往是最原初的结构类型[16],所以五元音体系很可能是人类语言最原始的元音体系。图4中的六种颜色代表六个地理区域的语系类群。在网络的中部,各个地理区域的语系类群并没有明显的分野。而在网络的边缘,地理和分类上相近的语种体现出了一定的聚类,特别是汉语构成了一个独特的大分支(右上角) 。 4. 各个区域内部的多样性分析
由于全世界的语系过于复杂多样,如在同一个网络结构中标注如此多的语系,势必影响分辨。另外,语言在六大区域之间并没有太多的关联性,所以图5对六个区域的语言分别作网络结构分析。
非洲撒哈拉以南和澳洲的语言的元音音系多样性非常低,其网络结构都非常简单。在非洲内部,科伊桑语系没有多样性,尼罗-撒哈拉语系的多样性也较低,尼日尔-刚果语系可能因为语种较多、分布地域较广,多样性相对较高。澳洲的澳大利亚诸语系和巴布亚诸语系的多样性相差无几。巴布亚语群的元音音系以aeiou 的五元音体系为核心,而澳大利亚语群特别是帕玛宁干语系则以aiu 的三元音体系为主流。
李辉:人类语言基本元音体系的多样性分析
研究报告
图3 世界各语系和语种的基本元音总量的地理分布
Fig.3 The geographic distribution of the basic vowel quality inventories of the world languages clustered in families.
图4 世界各语种基本元音音系类型的网络结构 图中的编号与语种的对应关系在附表1中。
Fig.4 Network of the basic vowel quality systems of the world languages The correspondence between the codes in the figure and the languages is in Supplementary table 1.
COM. on C. A. 2:e7, 2008
图5 世界六区域分区的各语种基本元音音系类型的网络结构
Fig.5 Networks of the basic vowel quality systems of the languages in six geographic regions
撒哈拉以北地中海周边语区主要以亚非语系(闪含语系) 和印欧语系为主。图4中这两个语系的元音系统多样性较大,但是明显属
于不同的演化方向。欧洲还有孤立的巴斯克语(Basque)和高加索语群(Caucasic languages) ,很难与其他语系建立发生学上的
李辉:人类语言基本元音体系的多样性分析 联系。高加索语群的分布地域非常狭小,但是元音系统的多样性却很大,这与它们的语言分类上的复杂性也是吻合的。克什米尔山区的步如夏语(Burushaski)也被认为是一种孤立发生的语言,但是有学者尝试把他与巴斯克语和高加索语群建立发生学联系[17],也有认为起源上与原始印欧语系有关[18]。巴斯克语和步如夏语的元音系统还基本保留在5元音体系。南亚次大陆的荼拉维哒语系(Dravidian)与其他语系的联系也非常缺乏。在诺斯家超语系(Nostratic)理论中荼拉维哒被包括在亚非、印欧、阿尔泰、乌拉尔、高加索等语系一起[19]。而语言学界较为接受的是把荼拉维哒与欧亚大陆北部的阿尔泰、乌拉尔建立联系[20]。图5中看来,荼拉维哒的元音音系多样性很小。有趣的是,在图4中荼拉维哒的一个比较独特的类型(BF03:Toda)与阿尔泰语系的伊犁突厥语(EC17: Ili Turki)非常接近。
在东亚和太平洋的汉南语区,元音系统的多样性也非常大。南岛语系(Austronesian)的语种分化非常丰富,其元音音系的多样性也较高。某些南岛语的元音音系趋向于简化,发展为aiu 的三元音体系,这可能与澳大利亚的三元音体系的发生有一定的关联。大部分汉语方言由于舌尖元音的出现,形成了一个单独的分支,除了粤语、闽南话和广东的客家话。吴语的元音音系多样化极其丰富,但是与汉语其他方言是有紧密关联的,在网络结构中有较多交错。在网络中侗台语(Daic)处于南岛语和汉语的连接部,侗台语可能是联系汉藏语和南岛语的桥梁。
北极语区的各语系元音音系多样性也较大,其中阿尔泰语系的多样性最大,其次是乌拉尔语系和纳丁语系。白令地区的楚科奇-堪察加语系没有多样性,只有五元音音系;爱斯基摩-阿留申语系的元音音系又简化为三元音音系。日语和虾夷语(Ainu)基本停留在
研究报告
五元音音系,而两个孤立语,尼夫赫语(Nivkh)和叶尼塞语系却并未停留在五元音音系。
美洲内部(不包括北极地区的爱斯基摩-阿留申语系和纳丁语系) 的语言语系众多、分布杂乱,彼此之间较难建立联系。本文中采用了几种涵盖较全面的超语系假说以归并过多的小语系。从网络结构中看来,美洲语言虽然基本元音总量都不大,但是音系多样性却还是较高的,而且没有明确的规律可循。其中阿尔冈琴语系(Algonquian/Algic)由于语种众多,多样性也相对最高。
三、讨论
1. 基本元音音系的初始状态、复杂化和简化
从世界语言元音音系所构画的网络结构(图4) 看来,五元音音系(aeiou)很可能是人类语言的最原初状态。包括所有科伊桑语言的世界上最多的语种都是用五元音音系。七元音音系也是由五元音音系进化而来的,即由[e]分化出[ɛ],[o]分化出[ɔ]。这在尼日尔-刚果语系的许多七元音语言中表现得非常明显。在尼罗-撒哈拉语系的一些语言中,通过[i]分化出[ɪ],[u]分化出[ʊ],形成了九元音音系。六元音音系大多只是在五元音音系的基础上增加一个中央弱元音[ə],可以认为是由[a]弱化而成的。八元音、十元音也是分别在七元音、九元音的基础上由[a]的分化形成的。比如从古拉丁语的五元音演化为现代意大利语的八元音即增加了[ɛ]、[ɔ]和[ə](表1) 。在印欧语系的一些语言(如印地语和乌尔都语) 中,[ɛ]和[a]之间有增加了[æ],形成十一元音音系。值得关注的是,到这一步为止,前元音都是非圆唇的(iɪe ɛæa),后元音都是圆唇的(uʊo ɔ) 。这是人类口腔发音时的一种自然动作的体现。发圆唇音时,力量集中在使嘴唇变圆并前伸上,而舌位自然放松形成后元音;而发前元音时,力量集中在舌位前移上,嘴唇有自然放松成为非圆唇音。
流有关。
COM. on C. A. 2:e7, 2008
从十一元音音系以上,各种元音音系复杂化的过程分别选择了发展出圆唇前元音或者非圆唇后元音的各种方式,分别形成了(yʏøœ)和(ɯɤʌ) 等。也有的形成了中元音(ɨɵɞ) 。最复杂的语群,日尔曼语族和汉语吴方言群就经历了完全不同的元音音系复杂化过程。由此元音音系的复杂化达到了极致。比如世界语言中最复杂的元音音系,吴语中的奉贤金汇方言有1个舌尖音(ɿ) 和19个舌面音(iɪe ɛa ɨɯɤʌəy ʏøœɵɞuo ɔ)[14]。阿尔泰语系和乌拉尔语系的很多语言虽然只是七、八元音类型,却包含了(ɯœøy)等元音,这提示了它们可能是由更为复杂的元音音系再度简化而来的。
三元音音系很可能是由五元音音系简化而来的,即[e]合并入[i],[o]合并入[u]。四元音音系大多是[o]和[u]已合并而[e]和[i]未合并形成的,也有少数相反的例子。有的是在三元音音系的框架上保留一个弱元音[ə]。二元音则很可能是[i]和[u]合并入[ə]的结果,比如阿布哈兹语[9]和澳大利亚中部的阿冉哒语(Aranda)[21]。澳大利亚北部的咕噜岛(Groote Eylandt) 上的伊宁迪拉呱语(Enindhilyagwa)的二元音音系是[a]和[ɨ],实际说话时出现的[i]、[e]、[u]都没有语音识别意义[22],都被语言使用者认为是[ɨ]同类的发音,这也是高元音合并形成二元音音系的一个证据。阿布哈兹语和阿冉哒语的[a]和[ə]甚至可以认为只是声调的差异而不是元音的差异。
我们得到的人类语言的元音音系起源于五元音音系的证据并不是确证,三元音或者一元音也可能并不是五元音简化而来,而是更原始的状态。但是鉴于现代人类都是起源于非洲的,而非洲并不存在比五元音音系更简单的音系,最古老的科伊桑语系甚至全部语种都是五元音音系。相反,三元音音系主要出现在人类迁徙的终点站——澳洲和美洲。所以种种迹象证明五元音音系应该是最
原始的。三元音音系的形成原因还不是很清楚,或许与群体与世隔绝、缺乏与外界的交2. 辅音、元音、声调总量的平衡和失衡
各种语言为了保持一定的信息负载效率,势必需要保持一定的音节种类总量。这需要辅音、元音和声调的总量整体维持在一定的总量或者增加单词的长度。其中一项总量的减少往往会伴随着另一项总量的增加。一些相近的语种之间这种平衡就比较明显。比如藏缅语族中普米语等的元音和声调总量都很小,但是辅音总量则变得极大,有大约58个辅音[23]。相比侗台语系的其他语种,侗语的元音和辅音都比较少,但是声调总量却达到了15[24]。所以一般来说,元音总量的减少并不会影响语言的表达功能,比如阿布哈兹语的辅音达到了67个[9]。但是也有些特例,比如澳大利亚的伊宁迪拉呱语的辅音也仅仅20个[22],阿冉哒语也只有27个辅音[21]。美洲的因纽特语(Inuktitut)只有15个辅音[25],克丘亚语(Quechua)只有25个辅音[26]。所以高加索某些语言的元音音系简化原因应该是与澳洲和美洲不同的,高加索的元音音系简化的同时维持了音素总量的平衡,而澳洲和美洲的一些元音系统简化却伴随了总体音素总量的失衡。
3. 语音数字化对语言学统计分析的启示
本文初步尝试了语音数字化分析,把语音转化为数字以后就可以应用于多种统计分析。本文的网络结构分析只使用了一种比较简单的数字化方法。在各语种的词汇比较分析中,也可以把元音转化而成的三位数字独立开来,这样就可以应用主成份分析(Principal Component Analysis)等聚类分析方法。辅音也可以根据其发音特征的不同设定几个维度,从而转化为数字。语音数字化以后,语言学的统计分析必然将更加多种多样,语言学也会越来越向自然科学靠拢。
李辉:人类语言基本元音体系的多样性分析
附表1 世界主要语种的基本单元音
Supplement table 1 The basic vowel systems of the major languages in the world
参考文献
1. Ladefoged P (1993) A Course in Phonetics (Third Edition). Fort Worth: Harcourt Brace Jovanovich. 197. 2. 陈炳藻(1980)从词汇上的统计论《红楼梦》作者的问题. 首届国际《红楼梦》研讨会. 美国威斯康星大学,1980年6月16-20日.
3. Bandelt HJ, Forster P, Rohl A (1999) Median-joining networks for inferring intraspecific phylogenies. Mol Biol Evol 16:37-48. 4. IPA(1999) Handbook of the International Phonetic Association. New York, NY : Cambridge University Press.
5. Bao ZM (1999) The structure of tone. New York: Oxford University Press. 6. Benedict PK(1984)Austro-Tai Parallel, A Tonal Chamic Language on Hainan. Computational Analyses of Asian and African Language 22:83-86.
7. Daniels PT, Bright W (1996) The World's Writing Systems. New York, NY: Oxford University Press.
8. Wright W (1971) A Grammar of the Arabic Language (3rd Ed). New York, NY: Cambridge University Press. 9. Hewitt BG (1979) Abkhaz. London: Routledge.
10. Maddieson I (2008) Vowel Quality Inventories. In: Haspelmath M, Dryer MS, Gil D, Comrie B (eds) The World Atlas of Language Structures Online. Munich: Max Planck Digital Library.
11. van Oostendorp M (1999) Schwa in Phonological Theory. In: Cheng L, Sybesma R (eds) The Second Glot International State-of-the-Article Book. New York: Mouton de Gruyter. 431-462.
12. Garlén C (1988) Svenskans fonologi. Lund, Sweden: Studenlitteratur.
研究报告
13. 钱乃荣(1992) 当代吴语研究. 上海:上海教育出版社.
14. 金二新(2008)金汇续志(1985-2002.5),第二十一章社会生活, 第六节方言. 上海:上海辞书出版社.419-422.
15. Güldemann T,Vossen R (2000) Khoisan. In: Heine B, Nurse D (eds) African languages: an introduction. Cambridge: Cambridge University Press.99-122.
16. Li H, Cai X, Winograd-Cort ER, Wen B, Cheng X, Qin Z, Liu W, Liu Y, Pan S, Qian J, Tan CC, Jin L (2007) Mitochondrial DNA diversity and population differentiation in southern East Asia. Am J Phys Anthropol 134:481-488.
17. Bengtson JD (2001) Genetic and Cultural Linguistic Links between Burushaski and the Caucasian Languages and Basque. The 3rd Harvard Round Table on Ethnogenesis of South and Central Asia, Harvard University, May 13, 2001.
18. Čašule I (2003) Evidence for the Indo-European Laryngeals in Burushaski and Its Genetic Affiliation with Indo-European. J Indoeuropean Studies 31: 21-86.
19. Bomhard AR, Kerns JC(1994) The Nostratic Macrofamily: A Study in Distant Linguistic Relationship. Berlin, New York, and Amsterdam: Mouton de Gruyter.
20. Krishnamurti B (2003) The Dravidian Languages. Cambridge, UK: Cambridge University Press.
21. Breen G (2001) The wonders of Arandic phonology. In: Simpson J, Nash D, Laughren M, Austin P, Alpher B (Eds) Forty Years On: Ken Hale and Australian Languages. Canberra: Pacific Linguistics. 45-69.
22. Leeding VJ (1989) Anindilyakwa phonology and morphology. PhD dissertation, University of Sydney.
23. 李辉(2008)兰坪县普米语拉丁字母拼写方案设计和应用. 第二届全国少数民族青年自然语言处理学术研讨会. 安徽, 合肥,2008年10月7-9日. 37-43.
24. 欧亨元(2004)侗汉词典. 北京: 民族出版社.
25. Kaplan LD (1981) Phonological Issues in North Alaskan Inupiaq. Alaska Native Language Center research papers, no. 6. Fairbanks, Alaska: Alaska Native Language Center.
26. Cusihuamán A (2001) Gramática Quechua Cuzco-Collao. Centro de Estudios Regionales Andinos "Bartolomé de Las Casas".