南岛语系

南岛语系(英文名:Austronesian family),又称“马来-波利尼西亚语系”,是按谱系分类法划分的一个语系,也是世界上唯一主要分布在岛屿上的一个语系。其分布地区西自非洲东南的马达加斯加岛,东至智利的复活节岛,北至中国台湾省和夏威夷岛,南至新西兰。南岛语系分为4个语族:印度尼西亚语族、密克罗尼西亚联邦语族、美拉尼西亚语族、波利尼西亚语族。截至2009年,《文化人类学视角的世界诸语言》把南岛语系的语言增加到1257种,使用人口近4亿。南岛语系属黏着型语言。词根附加成分和词根的重叠是构词和构形的主要手段。常用词大多为多音节。语序属谓主式。

原始南岛语(Proto-Austronesian,简称pan)是整个南岛语系的祖先语言。有关南岛语言的起源,学界观点多种多样。主要有四类:一类认为起源于中南半岛沿海一带;一类认为起源于中国大陆华南地区;一类认为起源于马来群岛的西新几内亚岛;最后一类认为起源于台湾岛,并由台湾岛开始向外扩散到菲律宾群岛北部、马里亚纳群岛群岛、印度尼西亚等地。1706年,荷兰人H.莱兰特发现了南岛诸语言的亲属关系。1784年,西班牙语言学家洛伦索·埃尔瓦斯-潘杜罗(Lorenzo Hervás y Panduro)在其著作《宇宙理念》(Idea dell‘宇宙)中语言学相关的部分便提出,应当将马来半岛、马达加斯加、印尼、菲律宾太平洋岛屿等地的语言联系在一起建构一个新的语系。1906年,威廉·施密特提出了南岛语系(Austronesian)和南亚语系(Austroasiatic)的命名,Austronesian才开始用来指代这个语系,并在20世纪60年代中期之后被广泛接受。

1942年,本尼迪克特(Paul Bennedict)研究发现南岛语与泰语(壮侗语,Tai)、加岱语(Kadai)存在同源关系,后来他将南岛、壮侗、加岱甚至苗瑶语统一归类为澳泰语系(Austro-Tai)。1992年,邓晓华的研究表明壮侗语与南岛语确实存在同源关系,证据是二者都有一批反映原南岛人文化的底层词,这些词属于日常生活基本词汇,借用的可能性很小。20世纪90年代,汉语与南岛语的关系开始被学界重视。沙加尔(Laurent Sagart)最早提出汉(语)南(岛语)同源说,认为二者之间存在发生学关系。进入21世纪以来,中国学者利用历史比较语言学或结合考古人类学、分子人类学方法来验证南岛民族起源假说,在探讨南岛语系与汉藏语系、南亚语系的关系,以及确定回辉话的性质等方面,都有一定程度的突破。

语系命名

南岛”(Austronesia),是由两个希腊文字的字根au-stro-与-nesia组合而成,前者为南方之意,后者意指群岛,所以“Austronesia”可以翻译成“南岛”,Austronesian即南岛语。1899年,威廉·施密特(W.Schmidt)在《孟高棉人群——中亚人和南岛人之间的连接》中正式用“南岛语”(Austronesischen Sprachen)一词来取代“马-波语系”。1906年,威廉·施密特在其南方大语系(Austric languages)的假说体系下,提出了南岛语系(Austronesian)和南亚语系(Austroasiatic)的命名,Austronesian才开始用来指代这个语系,并在20世纪60年代中期之后被广泛接受。

历史演变

起源

南岛语系的起源一直是语言学研究的热点问题之一。有关南岛语言的起源,学界观点多种多样。有人说它源于南亚语系,有人说它源于印欧语系,有人说它源于汉藏语系。起源地有密克罗尼西亚联邦、华南、台湾岛印度尼西亚、中南半岛、新几内亚岛西部等不同地区的说法。绝大多数认为是台湾岛。台湾岛是南岛语系的源头,泰雅族聚落是目前全世界南岛语人群地理分布上最北端的聚落,而台湾岛原住民在南岛文化中又占有举足轻重的地位。总的来说,现阶段有关南岛系语言起源的观点归纳起来主要有四类:一类认为起源于中南半岛沿海一带;一类认为起源于中国大陆华南地区;一类认为起源于马来群岛的西新几内亚;最后一类认为起源于台湾岛,并由台湾岛开始向外扩散。

自20世纪80年代起,线粒体脱氧核糖核酸被用来研究世界上不同族群之间的遗传演化历史关系。英国遗传人类学家梅尔顿等人的线粒体DNA研究结果显示玻利尼西亚人群起源于台湾岛,而另一些线粒体DNA研究对此提出不同看法,认为玻利尼西亚人群其实起源于印度尼西亚东部。2008年,是由乔纳森·弗里德兰德(Jonathan Friedlaender)所率领的国际团队进行的,他们对太平洋地区41个族群中的952个个体进行了研究。作者不同意大多数研究者以某个或数个单倍体为示踪指标的做法,而是分析了687类基因指标,既包括线粒体脱氧核糖核酸,也包含Y染色体。分析结果显示,波利尼西亚人和密克罗尼西亚联邦人与东亚,尤其是中国台湾原住居民的基因联系最密切,而与美拉尼西亚人关系甚远。这一结果不仅表明中国台湾和相邻的大陆地区是南岛语族的基因发源地,而且支持南岛语族在近大洋洲一带迁徙速度很快的观点。

2014年,德国马克斯·普朗克进化人类学研究所的团队从位于福建闽江口外马祖亮岛上的人骨提取DNA,并以单倍体E为示踪指标,结果清楚地表明,生活在东南亚群岛和近大洋洲地区的南岛语族的基因发源地就在福建沿海。2016年至2018年,斯科格兰在《自然》、利普森在《当代生物学期刊》、波斯特在《自然生态与进化》等国际学术刊物上陆续发表了数篇与太平洋岛屿古人类脱氧核糖核酸相关的文章,系统全面地展示了南岛语族在太平洋岛屿上的迁徙与扩散。认为所有东南亚岛屿的南岛语人群与台湾南岛人群具有强烈的亲缘关系,同时也接受了来自大陆中南半岛说南亚语人群的遗传贡献,这种南亚语相关的遗传贡献有可能是因为在南岛语人群迁徙之前,东南亚岛屿就已有说南亚语人群的存在;又或是南岛语人群经由中南半岛走廊而后再扩散至印度尼西亚东部地区。

2020年5月14日,由中国科学院古脊椎动物与古人类研究所付巧妹团队进行的研究。他们成功地在福建省的奇和洞、昙石山和溪头遗址的史前人骨中提取了脱氧核糖核酸,其结果更进一步证明:福建地区新石器时代的人群是西太平洋地区各岛屿上的南岛语族的祖先。

发展

原始南岛语本身是重建的结果,包含整个南岛语系的祖先词汇,以及它的祖先音系和许多语法特征。语言学家们在整个南岛世界现存语言中寻找共有的继承性同源词,从而重建了该语言。原始南岛语(Proto-Austronesian,简称pan)是整个南岛语系的祖先语言。这一观点最初由语言学家白乐思提出,获得了绝大多数现代语言学家的认同。根据大多数语言学家的说法,在南岛人定居台湾岛之前,南岛语的祖先语言业已存在,分布于中国大陆沿海地区,源头在长江以南的某个地方。经过早期的大陆祖先阶段之后,最初的南岛语开始在台湾岛传播,后来岛上的原始南岛语分裂,成为现代某些或所有土著南岛语的根源。但是,被称为马来-波利尼西亚语的南岛语分支在今天的台湾岛并不存在。一般认为这个语支的源头是在台湾岛,由台湾岛扩散到菲律宾群岛北部,并在菲律宾群岛北部发生了语言分化,逐渐远离了台湾岛的母语。传播范围并不限于菲律宾群岛,原始马来-波利尼西亚语后来从岛屿东南亚传播到大洋洲——先到马里亚纳群岛,然后稍晚从菲律宾群岛或印度尼西亚等地,经过美拉尼西亚,到达东波利尼西亚,向西又传播到马达加斯加。最终波利尼西亚人在公元13世纪到达新西兰

1521年,麦哲伦探险队开始首次环球航行时便与关岛以及菲律宾萨马岛宿务岛和马克坦岛等岛屿土著人群有所接触和冲突,并在与马克坦岛的部落冲突中被杀。此后的16-18世纪,来自欧洲的不同探险家和学者记录了东南亚、太平洋岛屿和马达加斯加的多种文化和语言,为后来的研究者识别出这些语言之间的联系奠定了重要的材料基础。1706年荷兰人H.莱兰特发现了南岛诸语言的亲属关系。1784年,西班牙语言学家洛伦索·埃尔瓦斯-潘杜罗(Lorenzo Hervás y Panduro)在其著作《宇宙理念》(Idea dell‘宇宙)中语言学相关的部分便提出,应当将马来半岛、马达加斯加印度尼西亚菲律宾和太平洋岛屿等地的语言联系在一起建构一个新的语系。

1800年,埃尔瓦斯出版了《语言目录》,继续论证马来语和波利尼西亚语之间的发生学关系,真正系统地建立起“马来-波利尼西亚语系假说”。1838年,德国哲学家和语言学家F.W.von洪堡(FriedrichWilhelm von Humboldt,1767~1835)首次使用科学的证据,在《论爪哇岛上的卡维语》一书中仔细研究了马来半岛和波利尼西亚一带九种语言的词汇表,并首次把这些语言置于“马来-波利尼西亚语系”之下。1899年,德国学者W.施密特(WilhFSchmidt,1868~1954)在他的文章中采用南岛语(Austronesian)这个词取代了“马来-波利尼西亚语”。施密特还按地将南岛语系分为四组,即印度尼西亚语、波利尼西亚语、美拉尼西亚语和密克罗尼西亚联邦语。19世纪末,荷兰学者柯恩(Hendrik Kern)就对110多种南岛语言中的30组同源词进行了研究,据此构拟出原南岛语(Proto-Austronesian),并对南岛语族的原居地进行了推测。

1978年,白乐思把南岛语一分为四,其中三支在台湾地区,分别是泰雅语、邹语和排湾语;台湾地区以外的南岛语合为一支,称为马来-波利尼西亚语。同时,白乐思还把马来-波利尼西亚语进一步区分为西马来-波利尼西亚语、中东部马来-波利尼西亚语两支,后者再进一步分为中支和东支,东支又分为南哈尔马哈拉-西新几内亚岛语和大洋洲语。这一分类已成为有代表性的主流派的意见。其他学者在白乐思的基础上进一步地完善台湾地区以外南岛语的分类,将西马来-波利尼西亚语区分为巴丹语群、北菲律宾语群、巽他语群和苏拉威西语群四支。

后来,白乐思又提出新的分类,把南岛语系分为10个主要语支,即邹语、西部平原语、西北台湾南岛语、泰雅语、东部台湾民语、布农语、鲁凯语、卑南语、排湾语和马来-波利尼西亚语。其中九个语支在台湾地区,马来-波利尼西亚语包括所有台湾地区外的南岛语以及台湾岛上的一种语言。2000年,B.F.格兰姆斯(Barbara F.Grimes,美国,1930~2014)编辑的《文化人类学视角的世界诸语言》把南岛语系分为两大次语系,即台湾南岛语和马来-波利尼西亚语。前者包括23种语言,进一步分成泰雅语、排湾语和邹语三大系统;后者则有1239种语言,分为中东部马来-波利尼西亚语、西马来-波利尼西亚语以及两种尚无法归类的语言。截至2009年,《文化人类学视角的世界诸语言》把南岛语系的语言增加到1257种。

分布

世界

南岛语主要分布在太平洋的岛屿和东南亚地区,西自非洲东南的马达加斯加岛,东至智利的复活节岛,北至中国台湾省和夏威夷岛,南至新西兰岛,包括中国台湾、马来西亚印度尼西亚菲律宾巴布亚新几内亚密克罗尼西亚联邦所罗门群岛瓦努阿图、新喀里多尼西亚、马绍尔群岛吉尔伯特环形山萨摩亚、汤加、夏威夷、新西兰、复活节岛和马达加斯加等地。

中国

中国台湾地区是南岛语系分布的最北端,居住在台湾地区的南岛语民族称为高山族,使用的语言包括泰雅语、赛德克语、太鲁阁国家公园语、邹语、卡那卡那富语、沙阿鲁阿语、鲁凯语、布农语、排湾语、卑南语、赛夏语、阿美语、撒奇莱雅语、达悟语(也称雅美语)、邵语、噶玛兰语等,使用人口约45万。另外,海南省三亚市回辉、回新村回族使用的回辉话也是一种南岛语,使用人口近万人(据三亚市政府2008年统计数字有9037人)。

内部分类

多样化分类

南岛语系的分类是基于系统性和科学性的原则进行的。学者们通过研究各种语言之间的词汇、语音、语法等特征,以及历史、文化和地理分布等因素,将它们划分为不同的语系、语族、语支。这种分类方案是经过深入研究和论证的,具有一定的科学性和准确性。不过,南岛语系语言的分类充满了争议和挑战。由于南太平洋地区语言的复杂性和多样性,确定性的分类方案很难找到。到了现代,随着资料收集越来越多,各位学者的视角不同,导致分类越来越多样化。

里德对南岛语系语言进行了广泛细致的研究,试图将各种南岛语系语言划分为更为具体的语系和语族。他综合考虑了词汇、语音、语法等多个方面的特征,并结合历史、文化和地理分布等因素,使用了明确的分类标准,因此他的分类在南岛语系研究领域具有一定的影响力。由于南岛语系语言的复杂性和多样性,对它的分类学界很难达成一致。有些学者对托马斯·里德的分类结果产生了质疑,并提出了不同的分类。

白乐思对南岛语系进行了广泛而深入的研究,并提出了自己的南岛语分类。他基于语音、词汇、语法等多个层面的语言特征,将南岛语系划分为多个下位语支,并对各个下位语支进行了详细描述。白乐思把南岛语系分为10个主要语支,即邹语、西部平原语、西北台湾南岛语、泰雅语、东部台湾民语、布农语、鲁凯语、卑南语、排湾语和马来-波利尼西亚语。其中九个语支在台湾地区,马来-波利尼西亚语包括所有台湾地区外的南岛语以及台湾岛上的一种语言。

2009年,罗斯(Malcolm David Ross)根据不同台湾南岛语的形态证据提出新的南岛语系分类。他认为目前原始南岛语的构拟实际上与某个中间阶段相对应,称为“原始核心南岛语(Proto-Nuclear Austronesian)”。

此外,根据“民族语”网站上的分类,南岛语系可以分为九大次语系:台湾岛东部原住民语(East Formosan languages)、台湾岛西北原住民语、布农语(Bunun)、泰雅语(Atayalic)、排湾语(Paiwanic)、卑南语(Puyuma)、鲁凯语(Rukai)、西部平原语、马来-玻利尼西亚语(Malayo-Polynesian languages),还有一种无法归类的语言。

语族介绍

南岛语系分为印度尼西亚语族、密克罗尼西亚联邦语族、美拉尼西亚语族和波利尼西亚语族四个语族的四分法。

波利尼西亚语族

波利尼西亚语族一般指波利尼西亚人,波利尼西亚人(Polynesians)是大洋洲东部波利尼西亚群岛的一个民族集团,包括毛利人、萨摩亚人、汤加人、图瓦卢人、夏威夷人、塔希提人、托克劳人、库克岛人、瓦利斯人、纽埃人、复活节岛人等10多个支系,共有90多万人(1978年)。波利尼西亚人属南方蒙古人种和澳大利亚人种的混合类型,身材中等偏高,皮肤为浅褐色,体毛较少,头发为宽幅波状黑发,面部宽大,略呈颌突。使用多种语言和方言,彼此差别不大,同属南岛语系波利尼西亚语族。

波利尼西亚语族分布在国际日期变更线以东,太平洋中部和东部的新西兰萨摩亚汤加纽埃、库克、土阿莫土、马克萨斯、瓦利斯、夏威夷、复活节岛等岛屿上。包括毛利语、萨摩亚语、乌维亚语、汤加语、纽埃语、拉罗通加语、塔希提语、土阿莫土语、马克萨斯语、夏威夷语、拉帕努伊语等共约100多种语言、方言和次方言。波利尼西亚语族语言的辅音有13个,元音有5个,但长短元音是不同的音位。语法特点是名词前有不定冠词和定冠词,名词的复数在前面加特殊的助词,物主代词有独立形式,数词一般是十进位计数法(夏威夷语和马克萨斯语保存着古老的四进位计数法),形容词的级用句法形式表示,动词有时、体、态、式等语法范畴。谓语一般出现在句首。

北岛现有20万毛利人,大约有一半使用毛利语。毛利文采用拉丁字母。萨摩亚群岛的西萨摩亚有12.5万人,东萨摩亚有2.5万人使用萨摩亚语萨摩亚文采用拉丁字母。塔希提岛约有5万人使用塔希提语。塔希提文采用拉丁字母。汤加群岛约有7.5万人使用汤加语。汤加文采用拉丁字母。夏威夷群岛上目前约有7500人使用夏威夷语夏威夷王国文采用拉丁字母。瓦利斯群岛约有5000人使用乌维亚语。纽埃约有5000人使用纽埃语。库克群岛约有5000人使用拉罗通加语。土阿莫土群岛约有5000人使用土阿莫土语。马克萨斯群岛约有5000人使用马克萨斯语。

美拉尼西亚语族

美拉尼西亚语族大约包括400种语言,大多与密克罗尼西亚联邦语族及波利尼西亚语族相近,具体语言的使用人数从几百到几千不等。美拉尼西亚语族的语言几乎没有文字记载。斐济语是美拉尼西亚语族中最重要的一种语言,使用人口约33.4万,广泛使用于斐济的报刊、广播及政府公告。其他有影响力的语言还包括莫图语(Motu)、罗维阿娜语(Roviana)、班巴塔纳语(Bambatana)、布戈图语(Bugotu)、托莱语(Tolai)、雅比姆语(Yabem)和莫塔语(Mota)等。除有南岛语系的一般特征外,美拉尼西亚语族语言的辅音有2个齿间音和7个软腭化音,有4个二合元音。名词按表示的事物与所有者关系的亲疏可分成两类。数词有五进位计数法。动词有人称和数的语法范畴,用加短尾代词表示。其使用者主要分布在美拉尼西亚群岛。使用人数不足百万。

印度尼西亚语族

印尼语族包括马来-印度尼西亚语支、台湾语支、占语支、巴丹语支等。我国南岛语属印度尼西亚语族,其中分布在台湾本岛的同属台湾语支,内部可分为三大语群:(一)泰雅语群,含泰雅(Atayal)、赛德克(Sediq)、太鲁阁国家公园(Truku)语;(二)排湾语群,含排湾(Paiwan)、鲁凯(Rukai)、布农(Bunun)、赛夏(Saisiyat)、阿美(Amis)、撒奇莱雅(Sakizaya)、卑南(Puyuma)语;(三)邹语群,包含邹(Tsou)、卡那卡那富(Kanakanavu)、沙阿鲁阿(Saaroa)语等。另外,分布在兰屿岛的雅美(Yami)语(即达悟语)属菲律宾巴丹语支。此外,分布在海南三亚的回辉话属占语支,于宋元之际从中南半岛迁徙而来。印度尼西亚语族主要分布在印尼、中国、马来西亚、菲律宾、马达加斯加、越南柬埔寨等国,使用人口1.1亿多。

密克罗尼西亚语族

密克罗尼西亚语族是南岛语系的语族之一,分布在赤道以北和国际日期变更线以西的马里亚纳、马绍尔、加罗林、关岛、吉尔伯特环形山、特鲁克、波纳佩、帕劳、雅浦、瑙鲁等岛屿上。密克罗尼西亚语族包括马绍尔语、查莫罗语、吉尔伯特语、特鲁克语、波纳佩语、帕劳语、雅浦语、瑙鲁语、乌利蒂语、库赛语、塞班语、耶鲁托语。其中,马绍尔群岛群岛约有2万人使用马绍尔语,马绍尔文采用拉丁字母;关岛约有4万人使用查莫罗语,查莫罗文也采用拉丁字母;吉尔伯特群岛约有4万人使用吉尔伯特语;特鲁克群岛约有2.5万人使用特鲁克语;波纳佩岛约有1.5万人使用波纳佩语;帕劳群岛约有1万人使用帕劳语;雅浦岛约有5000人使用雅浦语;瑙鲁约有5000人使用瑙鲁语加罗林群岛约有4000人使用乌利蒂语;库赛岛约有3600人使用库赛语。该语族有软腭化辅音元音同化现象。名词有数和领属格范畴。人称代词有复杂的数和分类系统。动词或动词前的时态助词加前加成分表示人称和数。

语言特点

南岛语系的语言特点因具体语言而异。每种南岛语系的语言都有其独特之处。南岛诸语言属黏着型,词根加附加成分或词根的重叠(或部分重叠)是构词和构形的主要手段,附加成分有前加、中加和后加三类。

语法

德国学者丹波夫,日本学者小川尚义、浅井惠伦、土田滋,美国学者戴恩等都对古南岛语语音做了拟测。该语系常用词大多为双音节;语法特点为人名、普通名词、方位名词分别加不同的冠词;代词有人称和数的范畴,第一人称复数有包括式和排除式两种;动词有时、体、态、式等范畴;数词有十进位、五进位、四进位等计数法;大多数词根既能用作名词,也能用作动词;词序往往随着谓语的性质而变动,谓语有的语言出现在句首,有的语言出现在主语之后。如大多数台湾岛语和菲律宾语的语序为VSO或VOS,否定助词和否定标记可以在主动词(main verb)之前。有些语言,如邵语和赛夏语,语序为SVO,可能是由于与汉语的长期接触而产生的与汉语相似的语序。

苏拉维西和印度尼西亚东部大多数语言的动词都有前缀主语标记。在一些语言里,这些标记主语与完全自由代词同时出现,表现出一致性。在美拉尼西亚西部的一些语言中,如摩图语(Motu),动词复合词由前缀主语标记、动词词干和后缀宾语标记以及标记主语和宾语的自由名词或代词组成,产生了结构theman the dog he-kicked-it 而非 the man kicked the dog。在这种情况下,动词复合词的结构提供了线索,即,现在的SOV句子结构来源于早期的SVO。

重叠

南岛语中的重叠有多种形式,表达多种功能。台湾岛鲁凯语和菲律宾他加禄语里动词词干的部分重叠用来标记将来时,如:他加禄语的l-um-akad“走”,la-lakad“将要走”;或者s-um-ulat“写”,但是su-sulat“将要写”。印度尼西亚马来语(Bahasa)使用完全重叠用来标记名词复数,如anak是“孩子”,anak anak是“孩子们”。在许多语言里,重叠与词缀一起使用表达各种语义差别。如印尼的anak anak-an“木偶”或orange orange-an“稻草人”只是多数现象中的一种。

音节规范

规范形状(canonical shape)一词是指一些语言在构词中对音节的数量、辅音元音的排序等表现出明显的偏好,但许多南岛语在实词(具有参考而不是纯粹语法功能的词)中表现出对双音节规范形状的明显偏好。这种偏好被其他力量打破,它经常通过特殊的机制重现。爪哇语əri“刺”一定经过ri阶段,后来为了迎合双元音规范形状才增加了一个央元音ə。在南岛语言中,还可以看到很多这种类型的、表现异常的例子。在大多数大洋洲语和其他地区的一些南岛语里,所有词语以元音结尾。这是两种变化的结果:辅音丢失或增加“回声(echo)”元音或不变的“支持(supporting)”元音。斐济语和玻利尼西亚语由于第一类发展而表现出开放的尾音节;美拉尼西亚语西部和马达加斯加语的姆骚语(Mussau)由于第二种发展而展现出开放的尾音节。

元辅音

大多数南岛语有16-22个辅音,4-5个元音。美拉尼西亚南忠诚岛上的语言就发现有非常多的辅音,而在玻利尼西亚语里辅音极少。夏威夷语音素很少,只有8个辅音(p,k,?,m,n,l,h,w)和5个元音(a,e,i,o,u)。南岛语元音系统很简单。台湾岛菲律宾印度尼西亚的许多语言只有4个对立元音:i,u,a和e,一个模糊的中央元音(mid-Central vowel)。绝大多数大洋洲语言有五元音系统:a,e,i,o,u。在很多密克罗尼西亚语、一些美拉尼西亚语(如瓦努阿图北中部的萨卡奥语)和一些占语里,有大量的元音系统。有些罕见的南岛语语音,如有些台湾岛语有小舌塞音(q),它的发音是将舌头的最后部分向下拉,以接触咽壁。很多加里曼语和其他语言都有不同寻常的鼻辅音:前爆鼻音(preploded nasals),在词尾会听到鼻辅音/-pm/,/-tn/和/-kŋ/,和后爆鼻音(postploded nasal)/-mb-/,/-nd-/,或/-ŋg-/,元音间的鼻辅音后跟塞音,但是塞音持续时间太短,几乎听不见。

台湾岛中部的一些语言,加里曼西北的大量语言,东南亚大陆的占语,小巽他群岛的几种语言里都发现了先喉塞音(preglottalized)或内爆音。在斐济语美拉尼西亚语的许多其他语言里,浊塞音b,d,g自动前加鼻音,即mb,nd,ŋg。南岛语最不常见的辅音类型是前鼻双唇颤音(prenasalized bi-labial trills),即,在m后颤抖嘴唇,通过上唇接触舌尖产生舌尖唇塞音(鼻音和擦音)。前者在美拉尼西亚西部金钟群岛的马努斯岛(Manus)语言里很常见,后者散见于瓦努阿图中部的大量语言里。

声域声调

东南亚大陆的许多南岛语区分两种声域(voice register):呼吸音或阴森音(breathy或sepulchral)(放松声带),和清音(clear voice)(收紧声带)。由于几代人双语,大多数占语都有了这个特征。当他们进一步接触到有声调的语言时,如占语(越南语)或回辉语(Tsat)(海南岛的汉语和壮侗声调语),至少有两种占语已基本上变为有声调的单音节语言。声调对立也广泛出现在新几内亚岛的两个地区和新喀里多尼亚南部的一些南岛语里。尽管台湾土著语言长期与汉语接触,并且这种接触可追溯到至少三个世纪之前,但是台湾土著语言没有产生声调。菲律宾的许多语言使用重音来区分单词,如他加禄语sábat“设计编织成布或席”,sabát“止动销或泥料”。有些菲律宾外的语言使用重音对比区分同一个词的不同形式,如苏门答腊岛北部托巴·巴塔克语(Toba Batak)gógo“死劲推”,gogó“强”或者díla“舌头”,dilá“一个健谈的人”。重音对比的起源和历史仍是南岛语研究中尚未解决的主要问题之一。

语系关系

Humboldt(1836-1839)、Bopp(1841)等认为所有南岛语都是印欧语系印度-伊朗语支印地语分支的成员。Schmidt在他的著作《孟高棉人》第四章表示,南亚语系和南岛语系一起构成一个更大的语系——南方大语系(Austric)。Macdonald(1907)提出南岛-闪语系假说,他的假说仅仅根据地理分布。Rivet(1925)认为美拉-波利尼西亚语和霍坎语有共同历史来源。Labberton(1924)认为南岛语(称为“马来-波利尼西亚语”)与日语存在发生学关系。Kawamoto从1977年开始也证明日语与南岛语言同源,Benedict(1990)把他1942年的澳泰语系假说(1942年的分类包括卡岱语、南岛语、南亚语和苗瑶语,他从1967年到1975年发表了一系列文章证明澳泰语系假说,并提出了上百个新词源和原始形式)加以扩展,把日语囊括其中。Sagart从1990年开始,不断撰文证明汉藏语和南岛语同源,并最终扩展为包括南亚语、南岛语、苗瑶语、汉藏语的东亚超级语系(Sagart 1990,2005)。此说得到中国学者邢公畹的支持。美国学者Blevins(2007)提出尼科巴群岛的加拉瓦语和昂格语构成一个“翁干”语系,为南岛语的姊妹语,二者构成“翁干-南岛”超级语系。

南岛语与壮侗语

1988年,倪大白认为从南岛语(以印尼语为代表)到壮侗语,虽经历了从多音节到单音节、从无声调到有声调的重大变化,但壮侗语同源词的基本面貌仍源自南岛语。1992年邓晓华的研究表明壮侗语与南岛语确实存在同源关系,证据是二者都有一批反映原南岛人文化的底层词,这些词属于日常生活基本词汇,借用的可能性很小。

南岛语与泰语

1942年,本尼迪克特(Paul Bennedict)研究发现南岛语与泰语(壮侗语,Tai)、加岱语(Kadai)存在同源关系,后来他将南岛、壮侗、加岱甚至苗瑶语统一归类为澳泰语系(Austro-Tai)。他认为在400多个作为例证的词根中,许多词根的系统语音对应关系已经明确。他还构拟了澳泰语的一些基本词汇,如水田、米、甘蔗水牛等。因此,他认为“如果我们承认这三个语系(指壮侗、加岱、印尼语)在发生学上有联系,我们必须把它们分散的中心定在中国南部地区的某些地方”,“操原始印尼语的人民是从中国南部海岸,也许经过海南岛往北迁移到台湾,往东迁移到菲律宾,往南迁移到越南加里曼丹岛、爪哇、苏门答腊岛和马来半岛”。

南岛语与汉语

20世纪90年代,汉语与南岛语的关系开始被学界重视。沙加尔(Laurent Sagart)最早提出汉(语)南(岛语)同源说,他认为汉语与南岛语之间具有成型的语音对应规律,非常相似的中缀变化,包括封闭性词类和一般的基本词汇的词汇对照,表明二者之间很大可能存在发生学关系。语音对应方面,汉语的单音节词与南岛语多音节词的最后一个音节对应;中缀变化方面,古汉语中缀-j-、-r-分别与南岛语中缀-in-、-ar-对应,例如,在古汉语中当词根是动词,插入-j-可表示承受者,或动作的工具、手段,而南岛语中-in-亦有类似的作用。沙加尔认为汉语-南岛语发源于距今8000-7000年前的黄河中游地区,当地已经开始种植水稻、小米,并有凿齿等习俗。萨加尔甫一提出汉-南同源学说,中国学者就给出了较为正面的回应。邢公畹认为:“从我能同意的例子看,就足以说明汉语与南岛语是从一个共同祖语——原始汉澳语(Proto-Sino-Austronesian)衍生下来的。”邓晓华也发现一批闽、客(家)汉语方言与南岛语的同源词,并认为这反映了南方汉语中有不少古南岛语的成分。

南岛语与日语朝鲜语

地处东北亚且语言系属关系不明的日语、朝鲜语与广泛散布于西太平洋海域诸岛的南岛语族有零星的共同语言特征。如南岛语中有和日语、朝鲜语同为SOV语序的莫图语;日语的开音节结构和高低型音调与南岛语中的波利尼西亚语以及印尼语类似;松本信广曾列举出130个日语和南岛语的同源词;吴安其认为朝鲜语中有更多体现南岛语特征的基本成分,从语音、词汇、语法各方面列举了朝鲜语与中国台湾少数民族语、印度尼西亚语、他加禄语汤加语夏威夷语毛利语等南岛语诸语言之间的对应关系。

相关研究

中国研究现状

中国对南岛语的研究,可上溯到20世纪50年代。进入21世纪以来,中国南岛语研究成果主要表现在:

1.利用历史比较语言学或结合考古人类学、分子人类学方法来验证南岛民族起源假说,在探讨南岛语系与汉藏语系、南亚语系的关系,以及确定回辉话的性质等方面,都有一定程度的突破。

2.中国南岛语的语言结构描写研究一直持续推进,从语音、词汇、语法等方面描写各语言基本面貌的论文、专著持续问世,并在相关领域都取得不同程度的进展。此外,硕士、博士学位论文选取南岛语为研究对象的比重有所增加,选题从语音、词汇、语法到语义、语用均有涉猎。方言、词典编纂、语料库、书写符号系统研究起步稍晚,但也有了零的突破。

3.中国南岛语学者通过田野调查,依据具体语言事实,运用优选理论、制图理论等理论和方法,对语音方面如滑音的形成机制与音韵模式、韵尾辅音元音增删、词重音和语调、回辉话声调形成的机制,以及共时音变规律与历时语音演变规律;词汇方面如词类、一般词汇及词汇的语义、语用等;语法方面如派生构词法、重叠构词法、焦点系统、短语结构、语序、句法成分与句类等问题,取得了丰富的研究成果。

研究方向

起源争议

荷兰学者菲利克斯·克莱因的观点

他主要运用构拟的动植物群的古语材料来推断南岛语的起源地,尤其是只在某种特定气候条件下才能找到的动植物群。1889年他在《马来玻利尼西亚人群起源地的语言学证据》一文中,比较了遍布各地区的一百种南岛语言,并构拟出一些原始南岛语词汇。如从稻、米、旱田、水牛、鳄鱼、黑毛猴等词汇的分布区域来看,古南岛语的起源地指向中南半岛沿海一带。日本学者土田滋与克莱因的看法比较一致,并从“穿山甲”一词的分布地域更进一步证实了克莱因的看法。

中国大陆华南起源说

最早提出者是美国学者白保罗。他于1942年发表《台语、加岱语和印度尼西亚语-东南亚的一个新联盟》,首次将南岛语与侗台语进行比较,列出了近30个南岛、侗台语同源词,论述了南岛语与侗台语的同源关系,并结合民族学考古学证据证明它们共同起源地在中国的华南地区法国学者奥德里古尔也持相同观点,他认为南岛语的起源地应该在亚洲大陆东南沿海一带,介于海南岛台湾岛之间。

戴恩的观点

戴恩在1965年的《南岛语言的词汇统计分类》一文中,运用语言分布与民族迁徙学说来推测南岛语的起源问题。由于东新几内亚岛美拉尼西亚的语言属于东部南岛语大洋洲支系的一支,它们有一些共同的语言演变。那么南岛语言最分歧的地区也就只有新几内亚西部及其附近,因此这一地区最有可能是古南岛语的起源地。

贝尔伍德的观点

他提出了南岛语在太平洋岛屿上的迁徙与扩散路径,即“Express-Train”(快车)模型。简单来说,快车模型认为南岛语起源于台湾岛,从台湾岛开始,经菲律宾印度尼西亚东部,而后快速向玻利尼西亚扩散。格雷、德拉蒙德和格林希尔基于统计推断系统发育谱系树的托马斯·贝叶斯法,认为南岛语大约距今5200年前起源于台湾岛,并在一系列的定居停留和对外扩张中迅速穿越太平洋。李壬癸也赞同这个说法,他根据爱德华·萨皮尔的观点,认为语言最歧异的地区就有可能是该语族的发源地,也是语族扩展的中心。他发现,台湾岛的语言最纷歧,语言之间的差异最大,因此,台湾岛可能是南岛语的起源地。

与其他语言也有发生学关系

有学者认为南岛语系与其他语言也有发生学关系,构成一个超级语系,主要有四种。

白保罗的澳泰语系假说

他根据传统的比较法把南岛语和东南亚大陆内部的壮侗语联系起来,得到许家平(Weera Ostapirat)、布伦奇和沙加尔等人的支持。许家平假定了一系列的规则对应把这两个语系联系起来,南岛语是第一个从这个语系里分裂出来,而说壮侗语的人留在他们的故乡中国大陆。布伦奇认为,如果它们之间的关系是真的,那么它们的关系就不可能只是姊妹语。他认为原始壮侗语人群是迁徙到海南岛后又从菲律宾北部返回大陆的,他们的独特性源于与宏勉语和汉语接触之后的结果。后来白保罗又扩展了该语系,把日语也加进去了。

南方大语系(Austric)假说

有学者认为南亚语系和南岛语系应该存在发生学关系,但是二者更有可能是类型学关系。虽然如此,从形态证据来看,尼克巴语言和菲律宾的南岛语言之间存在着联系。白乐思支持把长江下游新石器时代澳泰语文化与水稻种植的南亚文化联系起来的假说,并且假定东亚水稻驯化的中心和推测的南方大语系的故乡都在中国云南与缅甸交界地带。根据这一观点,东亚南部地区基于水稻种植的人口扩张,出现了东西向的基因排列:南亚-壮侗一南岛,与之毫无关系的汉藏语系占据了更北的一层。

汉-南岛语系假说

法国语言学家、汉学家沙加尔认为南岛语系与汉藏语系同源,并且认为壮侗语与马来一玻利尼西亚语关系更紧密。基于基本词汇和形态相似性中的语音对应关系,他认为,汉语和南岛语之间存在南北同源关系。沙加尔得出结论,台湾岛南岛语有两种玉蜀黍属(而不仅仅是以前认为的狗尾草),把前南岛人定位于中国东北,与汉藏语可能的故乡相邻。5科奥等人的基因研究可能证明沙加尔的结论是正确的,他们指出南岛人的mtDNA单倍型群和汉藏族的M9a单倍型群显示二者是姊妹语,这个至少表明早期南岛人和汉藏人母系基因库之间存在着密切的联系。除此之外,魏等人的研究结果也与沙加尔的一致,他们的研究表明说南岛语的人的Y-DNA单倍型群03a2b *- P164(xM134)属于一个新定义的单倍型群03a2b2-N6,它广泛分布在从韩国到越南的亚洲东部沿海地区。沙加尔还以类似递归的方式给南岛语言分组,把壮侗语当作马来一玻利尼西亚的姊妹语。但是同行们发现他的方法论是假的。

日-南岛语系

白保罗、川本三郎、米勒等人都认为日语与南岛语有发生学关系。其他语言学家则认为二者没有发生学关系,只是受到南岛语底层的影响。提出这个假说的人认为南岛语系曾经覆盖整个岛屿,由南到北。罗贝兹认为日语应该属于跨欧亚语系(“Transeurasian”,即超级阿尔泰语系),但是受到了准南岛语(“para-Austronesian”原始南岛语的姊妹语)的词汇影响。语言学家库马尔认为一些南岛人可能迁徙到日本,可能是来自爪哇的精英团体,然后创建了日本等级社会。她也识别了82个日语和南岛语可能的同源词,然而她的理论仍有很大争议。

翁干-南岛语系

布莱文斯假定南岛语和原始翁干语都是原始南岛-翁干语的子语,但是主流语言学家都不认可,这个假说仍有很大争议。白乐思认为这个假说非常牵强,因其仅依靠偶然相似和有漏洞的方法论。

除此之外还有日-澳泰语系假说、南岛印欧语系假说、南岛-闪语系假说、南岛-美洲印第安语系假说。白乐思认为这些假说没有一种是有说服力的。李壬癸的态度稍有不同,他认为南方大语系假说最令人期待,因为它有两个重要的形态证据,南岛语和南亚语都有中缀-um-和-in-,并且有相似的功能,当它们同时出现时有着同样的顺序。与词汇、语音和句法相比,形态是最稳定的,不易变化的。而南岛一印欧语系假说、南岛一闪语系假说、南岛一美洲印第安语系假说、翁干一南岛语系假说都没有强有力的证据支撑。

古南岛语的分化

南岛语民族广泛分布在太平洋和印度洋的岛屿和半岛上,多数学者推测他们大约7000年前来自中国大陆东南沿海一带,其原始居留地可能包括台湾。南岛民族要扩散到如此广大的海域,且在移民之后又能在岛屿之间保持一些来往,学者认为南岛民族必须拥有优良的航海技能和舟船工具,因此在古南岛语中应存在丰富的航海与舟船词汇。这种推测在东部的密克罗尼西亚和西部的印尼语马来语菲律宾的南岛语得到了印证。然而,据土田滋、达尔、白乐思、戴恩等学者的研究,在台湾地区的南岛语中未见古南岛语舟船同源词。但李壬癸的《台湾南岛语的舟船同源词》一文,根据泰雅语、赛德克语、邹语、卡那卡那富语、沙阿鲁阿语、布农语、排湾语、卑南语、赛夏语、阿美语中普遍表示“漂流、被水冲走”的词形,构拟了古南岛语的“漂流”等相关词汇,证明台湾南岛语言中确实有关于航海和舟船的同源词,只不过由于台湾地区的南岛语较早失去舟船文化,导致舟船同源词数量远少于其他地区。

方言研究

台湾南岛语方言种类众多,泰雅语有泽敖列和赛考利克两个方言;赛德克语原分雾社、春阳、太鲁阁国家公园三个方言,后太鲁阁方言从赛德克语中分出,升格为太鲁阁语;阿美语原先分撒奇莱雅方言、北部方言(南势阿美)、太巴塑-马太安方言(秀姑峦阿美的太巴塑、马太安部落)、中部方言(海岸阿美和秀姑峦阿美)、南部方言(马兰阿美和恒春阿美),后撒奇莱雅方言从阿美语中分出,升格为撒奇莱雅语;布农语有三个方言:北部方言(卓社群、卡社群)、中部方言(峦社群、丹社群)和南部方言(郡社群);赛夏语分南部方言(东河方言)和北部方言(大隘方言);排湾语分东南部方言(含太麻里、狮子、来义、土坂四个土语)和西北部方言(含三地、筏湾两个土语);鲁凯语有茂林、万山、多纳、雾台、大武和大南等方言;邹语分久美、特富野、达邦三个方言;达悟语有四个方言:红头(红头、渔人社)、椰油、东清(东清、野银社)、朗岛方言。

参考资料

讲座纪要 | 邓振华:多学科视野下的南岛语族起源与扩散.北京大学考古文博学院.2025-09-30

浅谈世界语言谱系.北京语言文字工作协会.2025-09-30

南岛语系.中国大百科全书.2025-10-01

杜树海,郭健新 | 南岛语族的起源与扩散:成果、争论与新的解释.微信公众平台.2024-06-08

南岛语族起源与中国东南沿海考古.澎湃新闻.2025-09-30

来平潭寻南岛语族之根:起底人类史上一次神秘的迁徙之旅.百家号.2025-09-30

波利尼西亚语族 概述.中国民族文化资源库.2025-10-01

美拉尼西亚语族.中国大百科全书.2025-10-01

密克罗尼西亚语族.中国大百科全书.2025-10-01

多学科协作揭示史前人群交流——以亚洲东部沿海地带为例.中国社会科学网.2024-06-09