快好知 kuaihz订阅看过栏目

 

在研究了世界上一些主要语言以后,语言学家也象生物学家那样,把世界上的语言按相似程度分为语系语族语支和语种。

语系 代表语言 占世界语言百分比

印-欧 英语法语俄语烿こ语波斯语 48%

汉-藏 汉语藏语泰语缅甸语 24%

尼日尔-刚果 斯瓦希里语 6%

亚-非 阿拉伯语希伯来语 5%

马来亚-波利尼西亚印度尼西亚语泿斚罧骉语 5%

德拉维达 泰米尔语 3%

阿尔泰 土耳其语骏古语哈萨克语 2%

除了上面这些“可以归类的”语言以外,还有几种所谓的“独立语言”:日语(2%),朝鲜语(1%)和越南语(1%)。

世界上有多少种语言。一说七千多种,一说五千多种,汉语是联合国指定的六种工作语言之一,另外五种语言是英语、俄语、阿拉伯语、法语和西班牙语。

分类

Abkhaz阿布哈兹语

Achinese亚齐语

Acoli 阿乔利语

Adangme 阿当梅语

Afar

Afrihili(Aritifical language) 阿弗里希利

Afrikaans 南非所用之荷兰语(阿非利卡语)

Afro Asiatic(Other) 其它亚非语系

Akan 阿坎语

Akkadian阿卡德语

Albanian阿尔巴尼亚语

Aleut阿留申群岛之土语

Algonquian(Other) 其它阿尔贡语系

Altaic(Other) 其它阿尔泰语系

Amharic 阿比尼亚宫廷贵族的语言(阿姆哈拉语,一种南族语)

Apache languages阿帕切语

Arabic阿拉伯语

Aramaic阿拉米语

Arapaho 阿拉帕霍语

Arawak 阿拉瓦克语

Armenian亚美尼亚语

Artificial(Other) 其它人工语言

Assamese阿萨姆语

Athapascan(Other) 其它阿撒巴斯卡语系

Australian languages

阿塞拜疆语

Balinese巴里语

Baltic(Other)波罗的海地区之语言

Baluchi俾路支语

Bambara 班巴拉语

Bamileke languages 巴米累克语

Banda班达语

Bantu(Other)

Basa巴萨语

Bashkir巴什基尔语

Basque巴斯克语

Batak

Beja 别札语

Belarusian白俄罗斯语

Bemba 别姆巴语

Bengali 孟加拉语

Berber(Other) 北非&回教土族之语言

Bhojpuri博杰普尔语

Bihari

Bikol

Bini

Bislama

Braj布拉杰语

Breton布尔吞语

Buginese 布吉语

Bulgarian保加利亚语

Buriat

Burmese缅甸语

Caddo 卡多语

Carib 巴勒比语

Catalan 加泰隆语

Caucasian(Other) 其它高加索语系

Cebuano宿务语

Celtic(Other) 其它凯尔特语系

Central American Indian(Other) 其它中美印第安语系

Chagatai 查加语

Chamic languages

Chamorro查莫罗语

Chechen车臣语

Cherokee 彻罗基

Cheyenne 夏延语(切延内语)

Chibcha 契布卡语

Chinese汉语

Chinook Jargon 契努克语

Chipewyan

Choctaw 乔克托语

Czech 捷克语

Dakota 达科他语

Danish丹麦语

Dayak

Delaware 特拉瓦印第安人语

Dinka丁卡语

Divehi

埃塞俄比亚

Ewe 幽语

Ewondo

Fang 芳格语

Fanti芳蒂语

Faroese法罗语

Fijian斐济语

Finnish芬兰语

Finno-Ugrian(Other) 芬匈语(其它)

German,MiddleHigh(ca.3050-3500) 中古高地德语

German,OldHigh(ca.750-3050) 古代高地德语

Germanic(Other) 其它德语语系

Gilbertese吉尔伯特斯语

Gondi 岗德语

Gorontalo

Gothic哥达语

Grebo 格列博语

Greek,Ancient(to 3453)古希腊语

Greek,Modern(3453-) 近代希腊语

Guarani瓜拉尼语

Gujarati古吉拉特语

Gwich’in

Haida 海达语

Hausa豪萨语

Hawaiian夏威夷语

Hebrew希伯来语

Herero 赫雷罗语

Hiligaynon 希利盖农语

Himachali 赫马查利语

Hindi 北印度语(印地语)

Hiri Motu

Hittite

Hmong

Hnpa (胡帕语) 印度语(其它)

Indo-European(Other) 其它印欧语系

Indonesian印尼语

Interligua(International Auxiliary Language Association)国际辅助语

Interlingue

Inuktitut

Inupiaq

Iranian(Other) 其它伊朗语系

Irish爱尔兰语

Irish(Old) to 3300

Japanese日语

Javanese 爪哇语

Judeo-Arabic 犹太&阿拉伯语系

Judeo-Persian 犹太&波斯语系

Kabyle卡比尔语

Kachin 卡琴语

Kalatdlisut

Kamba 卡姆巴语

Kannada 坎纳达语

Kinyarwanda卢旺达

Kongo刚果语

Konkani 刚卡尼语

Korean 朝语

Kpelle 克佩列语

Kru 克鲁语

Kuanyama

Kumyk

Kurdish库尔德语

Kurukh 库鲁克语

Kusaie

Kutenai 库特内语

Kyrgyz 柯尔克孜语

Ladino拉迪诺语

Lahndi 拉亨达语

Lamba 兰巴语

Lao 老挝语

Latin 拉丁语

Latvian 拉脱维亚语

Letzeburgesch

Lezgian

Makasar望加锡

Malagasy马拉加斯语

Malay 马来语

Malayalam 德威拉土语之一(马拉维拉姆语)

Maltese马耳他语

Mandar

Mandingo 曼丁哥语

Manipuri曼尼普里

Manobolanguages马诺博污

Manx 人岛语

Maori 毛利语

Mapuche

Marathi 马拉蒂语

Mari

Marshall马歇尔语

Marwari 马尔尼里语

Masai 萨伊语

Mayan Languages玛雅语系

Nahuatl

Nauru

Northern Sotho 北索托

Norwegian 挪威语

Nubian languages努比亚语

Nyamwezi 尼亚姆韦齐语

Nyanja 尼昂加语

Nyankole

Nyoro 尼约罗语族

Nzima

Occitan(post-3500)

Ojibwa 北美印第安人&大种族之语(奥季布瓦语)

Old Norse

Old Persian(ca.600-400B.C.)

Oriya 奥里亚语

Papuan-Australian(Other) 其它巴布亚澳洲语系

Persian波斯语

Philippine(Other) 其它菲律宾语系

Phoenician

Polish 波兰语

Ponape 波纳佩语

Quechua盖丘亚语

Raeto-Romance 罗曼斯方言

Rajasthani 拉贾斯坦语

Rapanui

Rarotongan 拉罗汤加语

Santali

Sardinian

Sasak

Scots苏格兰语

Selkup塞尔库普语

Semitic(Other) 其它闪族语系

Serbo-Croatian(Cyrillic)塞尔维亚克罗地亚语(基里尔字母之一)

Serbo-Croatian(Roman) 塞尔维亚克罗地亚语(罗马字母)

Serer 谢列尔语 srr

Shan 掸语

Shona 绍纳语

Sorbian languages 索布诸语言(西斯拉夫诸语言和方言)

Sotho 索托语

South American Indian(Other)其它南美印第安语系

Spanish 西班牙语

Tatar塔塔尔语

Telugu 泰卢固语

Temne提姆语

Terena 泰雷诺语

Tetum

Thai 泰语

Tibetan 藏语

Tigre提格雷语

Turkish 土耳其语

Turkish,Ottoman 奥托曼土耳其语

Turkmen土库曼语

Ukrainian乌克兰语

Umbundu 莱都(姆崩杜语)

Undetermined 未定语种

Urdu 印度斯坦回教徒所通用之一种语言(乌尔都语)

Uzbek乌兹别克语

Vai 瓦伊语

Venda 文达语

Vietnamese 越南语

Volapuk

Votic 沃提克语

Wakashan languages

Walamo 瓦拉莫语

Warav

Washo 瓦绍语

Welsh威尔斯语

Wolof 沃洛夫语

Xhosa 科萨语

Yakut

Yao 瑶族语

Yap 雅浦语

Yiddish 依地语

Yoruba 约鲁巴语

Yupik languages

Zande

Zapotec 萨波蒂克语

Zenaga 泽纳加语

Zhuang

Zulu 祖鲁语

Zuni 祖尼语

语言分类

有些语言则只为几千乃至几百人使用,如美洲的土著印第安语,中国的鄂伦春语、赫哲语。

分类标准

一是按结构分类,即以语言结构的特点来进行分类。

⒈:词汇附着型语言。这种语言的词用在句子里时,词形不表示语法关系的形式,必须用其他词汇附着句子里,才能表达语法关系。如汉语中的时间,必须加表时间的词汇才能表达。

⒉ 字母附着型语言。这种语言的主要特点是靠词尾,前后缀(用一定的字母组合)等来产生语法形式,表示各种语言关系。例如英语,俄语中词的性,数,格,位的变化都是靠词尾和前后缀来表现的。印欧语系的语种,大多属于这一类型。

3. 混合型:以上两者兼有之。如日语中的主语,状语,宾语分别用字母 “が,に,を” 表示,而进行和已然时态则用词汇”ぁります, ぁりますした” 表示。

二是谱系分类。谱系分类是根据语言的历史渊源,地理位置,亲属关系,把世界上的语言分为若干语系,语系以内再分为若干语族,语族以下再分为若干语支。

分类方法

1.中国北京大学分类法

中国北京大学中文系教授徐通锵,胡吉成将世界语言分类为13个语系,45个语族。这13个语系是:汉藏语系、印欧语系、高加索语系乌拉尔语系、阿尔泰语系、达罗毗荼语系、南亚语系、南岛语系、闪--含语系、尼日尔—科尔多凡语系,尼罗---撒哈拉语系,科依桑语系,北美印第安语系。

2.英国Simon大学遗传学分类法

(1)欧亚语系,包括汉藏语系、印欧语系。

(2).太平洋和非洲语系,包括.除欧亚语系,南北美洲以外其他各国的语言。

(3).北美语系:北美洲土著印第安语言。

(4).南美语系:南美洲土著印第安语言。

3. 澳大利亚国家标准语言分类法

北欧语系,5个语族,16种语支

南欧语系,5个语族,16种语支

东欧语系,7个语族,25种语支

西南亚和北非语系,3个语族,21种语支

南亚语系,5个语族,16种语支

东南亚语系, 3个语族,23种语

东亚语系,4个语族,15种语支

澳洲土语语系,8个语族,56种语支

其他语系,7个语族,41种语支

4. 美国麻萨诸赛洲理工学院(麻理工学院)分类(完全按地区)

非洲语系:北非语族,南非语族,东非语族,西非语族

亚洲语系:北亚语族,南亚语族,东亚语族,西亚语族,中亚语族,东南亚语族

澳太语系: 澳大利亚及太平洋诸岛国。

北美语系:北美洲各国语言,包括土著印第安语言。

南美语系:南美洲各国语言,包括土著印第安语言。

欧洲语系:日耳曼语族,包括英语、德语、荷兰语、斯堪的纳维亚半岛各主要语言。拉丁语族,包括法语、意大利语、西班牙语、葡萄牙语和罗马尼亚语等。斯拉夫语族有俄语、保加利亚语、波兰语等。波罗的海语族包括拉脱维亚语立陶宛语等。

上述分类方法都有一个共同的缺点,就是都没有将人造国际语列入分类中。在当今世界,人造国际语已经如此普及的今天,这实在是一憾事。

综观上述,比较合理的分类方法应该是:

一. 印欧语系

印欧语系 是最大的语系,下分日耳曼、拉丁、斯拉夫、波罗的海,印度、伊朗、等语族。世界上除了亚洲(不含南亚各国)外,各大洲大部分国家都采用印欧语系的语言作为母语或官方语言。使用人数大约40亿,占世界人口的70%。

印欧语系可分为:

拉丁语族:包括法语、意大利语、西班牙语、葡萄牙语和罗马尼亚语等。

日耳曼语族:包括英语、德语、荷兰语、斯堪的纳维亚半岛各主要语言。

斯拉夫语族:有俄语、保加利亚语、波兰语,塞尔维亚语等。

波罗的海语族包括拉脱维亚语和立陶宛语等。

印度语族包括梵语、印地语、巴利语,达罗毗荼语支(印度南部的语言都属于这一语支)等。

伊朗语族包括波斯语、阿富汗语等。

高加索语族 这一语族的语言分布在高加索一带,主要的语言有格鲁吉亚语车臣语等。

乌拉尔语族 下分芬兰语支和乌戈尔语支。前者包括芬兰语、爱沙尼亚语等,后者包括匈牙利语、曼西语等。

二:. 汉藏语系

汉藏语系是仅次于印欧语系的第二大语种。使用人数大约15亿。下分汉语和藏缅、壮侗、苗瑶等语族,包括汉语、藏语、缅甸语、克伦语、壮语、苗语、瑶语等。还包括阿尔泰各语族,如西阿尔泰语族、东阿尔泰语族。前者包括突阙诸语言以及前苏联境内的楚瓦什语,后者包括蒙古语以及前苏联境内的埃文基语。

三: 非太语系:

包括除欧亚语系、南北美洲以外其他各国的语言。非洲及太平洋诸国采用这种语言。

尼罗—撒哈拉语族:主要是非洲北部及西部各国语言,

尼日尔—刚果语族:主要是非洲中部各国语言,如尼日尔语,刚果语,斯瓦西里语等。

科依桑语族:主要是非洲南部及东部各国语言,主要有霍屯督语(纳米比亚),布须曼语(南非等),散达维语(坦桑尼亚等)。

闪-含语族(闪米特-含米特语族)。主要应用于中东地区。下分闪语族和含语族。前者包括希伯来语、阿拉伯语等,后者包括古埃及语、豪萨语等。

南岛语族:主要有东南亚及太平洋各岛国语言,如印度尼西亚语马来语爪哇语,斐济语,毛利语等。

南北美洲土著印第安语言。如玛雅语,爱斯基摩—阿留申语等。

澳大利亚洲土语语言。

语言

印欧语系是世界上最大的语系,覆盖了几乎所有的欧洲軿洲,和亚洲澳洲的很大一部分菿包括两种伟大的古典语言:古希腊语和拉丁语;包括象英语德语,菏兰语(在比利时也叫佛兰芒语,Flemish)和瑞典语一类的日耳曼语族;包括象法语,意大利语和西班牙语一类的罗曼语族;包括象俄语,波兰语,捷克语和塞尔维亚-克罗地亚语一类的斯拉夫语族;包括象威尔士语和盖尔语(Gaelic,在苏格兰和爱尔兰)这样的塞尔特(Celtic)语族;包括巴尔的(Baltic)诸语言;包括伊朗的国语波斯语;包括诸如印地语忿加拉语一类的印地语言;等等

原始的印欧人生活在什么年代?是从何处“发迹”的?

在找不到原始印欧人留下的任何“书面材料”,因为人类使用语言的历史远比使用文字的历史久远所以,最好的办法就是分析他们的语言我们可以假定如果一个词在大多数印欧语言中都很相似,那就是一个他们已有的概念;反之就可以认为那是一个后来才知道的概念:这就是语言学重现“化石语言”所用的方法

通过重建古代印欧人的语言,我们大约可以了解到:原始的印欧人生活在寒冷的北方森林中一个不靠近水的地方,他们饲养的家畜有马,牛,羊和狗,他们知道的野生动物有狼和熊,他们知道的金属可能只有铜许多人认为马和战车使他们在征战中能取得很大优势从而扩展到后来的辽阔地域(玩过civilization的朋友们知道horse和chariot在古代战争中的作用:-)

一般认为原始印欧文明起自于公元前三千年,也就是五千年以前的东欧某地,大约在公元前二千五百年它分裂了,人们离开故乡分好几路向四面八方迁移盿中一路到了希腊,另一路到了意大利(这两路分别是古希腊和古罗马文化的起源)另一路穿过中欧一直到达不列颠诸岛(他们是苏格兰人,爱尔兰人和威尔士人的祖先)还有一路北上到了俄国,同时又有一路跨过伊朗,阿富汗最终到了印度他们每到一处,就征服或同化当地的土著,把自己的语言传播到那里铿该说他们是一个出色的民族

许多语言可能是从一个祖先那儿演变出来的,这想法最早是在1786年提出来的,尽管早在十六世纪有人就注意到了梵语和意大利语之间的相似性到了1818年,有五十多种语言归到了印欧语系中,然后在1854年,人们把独特的阿尔巴尼亚语也归了进来,1875年又加上了亚美尼亚语苿今在欧洲,只有芬兰语匈牙利语土耳其语巴斯克语(在西班牙和法国交界处)

和前苏联境内的几种语言不属于印欧语系

在亚洲,印欧语言出现在伊朗阿富汗巴基斯坦烿度和孟加拉等国家值得注意的是,虽然在印度,印地语(Hindi)是最大的语言,但是操非印地语的当地原住民势力也很强大烿度有一百五十多种语言,但讲任何一种语言的人都不超过百分之三十所以它在1947年独立时不得不同时采用印地语和英语作为官方语言——一半以上的印度人根本就不懂印地语嘛在大约公元前一千年印欧人入侵以前,当地原住民所操的德拉维达语系(如泰米尔语)

和蒙达语系,如今在印度中埿部人口中仍占很大的比例在巴基斯坦和孟加拉国大部分人讲印欧语言他们都能在一定程度上听懂印地语,但互相之间却很难听懂一个学法律的孟加拉朋友告诉我,他认为二十年前巴忿分裂成两国,除了地理上的隔阂外,语言上的隔阂也是一个重要因素

印欧语言之间究竟有多象?印欧语言与非印欧语言的差别有多大?看看几个“基本词汇”之间的比较:

英语month mother new nose three威尔士语mis mam newydd nos tri德语Monat Mutter neu Nase drei瑞典语ma^nad moder ny na"sa tre法语mois me`re nouveau nez trois西班牙语mes madre nuevo nariz tres意大利语mese madre nuovo notte tre俄语mesyats mat' novy nos tri希腊语men meter neos rhis treis_ _波斯语mah madar nau bini se_ _梵语mas matar nava nas trayas芬兰语kuukausi a"iti uusi nena" kolme匈牙利语ho'nap anya u'j orr ha'rom土耳其语ay anne yeni burun u"c,

发展

作为当今世界事实上的国际社交语言,它取得的成功是史无前例的从使用它的人口来说,以英语为母语的人数仅次于汉语而居世界第二位,大约有四亿多人然而以英语作为第二语言或者在一定程度上使用英语的人数,要远比这多得多,可以说分布在世界的各个角落各个民族,在这一点上汉语是望尘莫及的。

英伦三岛

的第一批印欧居民是塞尔特人原先岛上可能还有更早的居民,但是人烟稀少,所以没有留下多少遗迹前文提到,塞尔特人是古印欧人的一支,大约在四千五百年前离开他们在东欧的故乡向西迁移,在公元前一千年时(相当于我国商朝末年翿梉初年),他们成了德国南部阿尔卑斯山北麓的一个强大民族在公元前五百年左右(相当于我国春秋时期),他们开始向西迁移,后来到了英伦诸岛这就是印欧人的第一次“入侵”

印欧人

的第二次入侵是在公元五世纪中叶,德国和丹麦交界处有两个部落,一个是石勒苏益格(Schleswig)的盎格鲁(Angles),另一个是霍尔施坦因(Holstein)的萨克森(Saxon)石勒苏益格/霍尔施坦因现在是德国最北面的两个州,是第一次世界大战时德国从丹麦那里“取得”的这两个部落从那里跨过北海,占据了英格兰,原来的塞尔特人很快地后退到威尔士爱尔兰和苏格兰高地English一词就出自Angles,原意为“角落”,意即他们来自欧洲大陆的一角在古英语中Angle写作Engle,他们的语言叫做Englisc(在古英语中“sc”读如“sh”,如“sceap”——“sheep”)竿便说一句,“塞尔特”(Celt)中的c可以读如s或k,所以也叫“凯尔特”,美国人中有许多来自苏格兰和爱尔兰,所谓的“美国腔”可能是凯尔特口音波士顿不是有个著名的球队叫“凯尔特人队”嘛

诺曼人

古英语一直发展到公元1066年法国的诺曼人入侵在此以前,由于受北欧人和罗马人的影响,许多斯堪地那维亚词汇和拉丁词汇溶了进来前者如egg,cake,skin,leg,window,husband,sky,fellow,skill,anger,flat,ugly,odd,get,give,take,raise,call,die,they,their,them;后者如street,kitchen,kettle,cup,cheese,wine廿尔特语的遗迹大多留在地名中,如Thames,Kent,Dover

诺曼人的入侵为英语带来了大量的法语词汇,这使得现代英语中存现大量的同义/近义词:shut/close,answer/reply,smell/odor,yearly/annual,ask/demand,room/chamber,wish/desire,might/power(英语词/法语词)有一个有趣的现象是产肉的动物多是英语词,如ox,cow,calf,sheep,swine,deer,而它们的肉则是法语词,如beef,veal,mutton,pork,bacon,venison大概持法语的多为贵族统治者,只注意他们餐桌上的肉,并不在意牲畜们叫什么

另外在已有的英语/斯堪地那维亚语同义词基础上,如英语的wrath和斯堪地那维亚语的anger之外,法语又加了个ire连我们汉语也贡献了几个词:kowtow(叩头),typhoon(台风),sampan(舢板),kaolin(高岭土),tea(闽方言),shanghai(不是地名:-))

这些外来语使英语成为一个表达力丰富的语言尽管溶入了如此众多的“外来语”,古英语仍然构成了它的核心——不到五千的古英语单词一直保持到了今天在此期间英语逐渐向高层发展,1399年继承王位的亨利四世是第一个以英语为母语的英国国王在十四世纪快要结束的时候,乔叟(Chaucer)完成了『坎特伯雷的传说』(Canterbury Tales),以伦敦方言为代表的现代英语终于开始出现:一个来自当年“角落”的语言

汉藏语系

概述

汉藏语系里有一个“大家伙”,不用猜就知道菿恛汉藏语系总人口的85%以上不过,对于非印欧语言的语言学研究都不如印欧语系那样深入,它的起源发展演变等都有许多问题有待解决

汉藏语系分四个语族:汉语自成一家;藏-缅语族,包括藏语和缅甸语这两大语种,以及彝裿僳纳西拉祜濿虾撘京等上百个小语种;泰-老语族,包括泰语老挝语这两个国语,以及壮布依响等几个小语种(壮语不应算小语种!有一千多万人讲壮语,比一些小的语系还大,他们不是还有自己的自治区嘛);还有一个苗-瑶语族,由苗语瑶语组成另外,不少人认为越南语与汉语有远亲关系,事实上越南语有一半的词来源于汉语,但是它们的关系仍有待进一步研究

分布

汉藏语言的人除了在中国以外,还分布在缅甸烿度尼泊尔泰国老挝等国,以及在东南亚和世界各地的华人中总之,持汉藏语言的各民族中,汉族生活在最北面

汉语是论人口世界上最大的语言,有十多亿人以汉语为母语:这包括在台湾的二千万泿斚罧骉葎鑶繎万泰国的五百万骏港的五百万新加坡的二百万烿度尼西亚的一百万諿垍葓v繎万等汉语是联合国1945年成立时的五种工作语言之一(1974年又加上了阿拉伯语)

主要方言

汉语有七种主要的方言:北方方言约占总人口的四分之三,所覆盖的地域包括中国的东北仿北翿北燿东河南囿北和安徽忿苏的长江以北部分四川釿坎豓贵州的汉族人聚居区,在另外还有一些北方方言的“孤岛”如桂柳话,在福建翿罞貉海南;吴方言,通行于江苏的长江以南部分姿彭猪上海市,人口有七千万,是第二大方言;粤方言,主要流行于广东翿罞貉睔外华人中间,约有六千万人;闽方言,通行于福建台湾和东南亚诸国,约有六千万人,其中情形十分复杂,到了互不通行的程度,可能是汉人在秦汉时代南侵时与当地的语言交互的结果;湘方言通行于湖南;赣方言通行于江西,这两种方言的特征不太突出,受周围方言的影响较大;还有客家话,主要分布于广东翿罞撉迿建和台湾这些“方言”之间差别常常是很大——比如北京人听广州人讲话,决不比英国人听法国人讲话轻松,台湾人去听陕西话,也会听得一头雾水是什么理由语言学仍把这些方言统统归为一种语言?除了长期以来的统一民族统一文化和统一国家这些因素以外,还有一个重要的原因是文字——汉字

历史发展

从商朝的甲古文开始,汉字有三千多年的连续历史,三千多年来汉字的字形埿义的变化都是连续的与大多数其它语言不同的是,汉字的发展经历了一条象形—表意—形声的途径这条道路产生了两个主要效应:第一,随着文明的不断发展,语言所要表达的概念不断增加,使得汉字拥有了一个数量庞大的字符集(虽然现代汉语已经不用增加字符来表达新的概念,而是创造新词,这在一定程度上减少了使用的字数)汉字的庞大的字符集使它显得非常复杂:难学难记难用;第二,历史上的汉字作为表意文字(ideograph),文字与语音没有直接关系,无论用哪种语言或方言去读,意义没有变化这是几千年来各种口语分化交熔变迁,而汉字一直作为一种统一的文字被所有人认同的原因这一优势甚至体现在当它被别的语言借用的时候:哪怕不懂日语的人也能读懂一半意思吧汉字使操不同口语的人互相交流成为可能,而隔膜是统一的主要障碍

后来,随着汉字的演变,汉字已不再是纯粹的表意文字,许慎『说文解字』中的9353字里面,“形声字”占了80%以上,“会意字”不到20%,而甲骨文中形声字仅占20%多秿别是近代以来多音词的比例急剧上升,汉字已向表音文字方向发展(关于“形声字”“会意字”,后面还要提到)

现代汉语的文字仍有几万字之多,但是使用频率极不平衡满北京语言学院1985年的统计结果,最常出现的前十个字及其出现频率为:

的 4.16% (你每说二十五个字就要说一个!)

一 1.84%了 1.71%是 1.52%不 1.37%我 1.28%在 1.08%有 0.98%人 0.97%这 0.93%

累计 15.85%

前100字的累计字频已达47.34%,500字到了79.76%,2000字覆盖了98.07%,如果你认识4000字(就象我一样),你读一万个字只有四个不认得(当然读我写的东西再多你也不会有不认得的字,因为我认的字和你一样多)

语言学院还统计了词:共计出31159个不同的词,其中单音节词(一个字的)占12.2%,双音节词73.6%,三音节词7.6%,四音节词6.4%五以上的占0.2%,平均词长2.09前100词的累计频率为41.7%,2000词为82.2%,9000词为95.85%不同汉字的构词能力(与别的字组成新词的能力)也不一样,最多的是“子”字,构词668个

中国语言

在中国境内的语言是多种多样的,

北方的语言多属阿尔泰语系,有属阿尔泰语系突厥语族的维吾尔语哈萨克语乌孜别克语柯尔克孜语哿员尔语(鞑靼语)鋿拉语(青海境内的撒拉族);阿尔泰语系通古斯语族的满语锡伯语鄂温克语鄂伦春语;阿尔泰语系蒙古语族的蒙古语达斡尔语东乡语和土语(青海土族的语言);还有印欧语系的俄语和伊朗语族塔吉克语等等地方的语言多属汉藏语系,除了上文提到的汉-藏语系诸语言外,尚有属南亚语系孟-高棉语族佤语德昂语布朗语,以及属南亚语系印度尼西亚语族的高山语(台湾高山族)

中国境内文字的种类同样多种多样擿蚖坛用(或部分使用)汉字的语言以外,还有许多使用罗马拼音文字,如壮文这其中又有不少是原本没有文字的,“新中国成立后,当地人民政府依照本民族人民的意愿,为他们创造了以拼音字母为基础的文字”还有使用梵语字母的如藏文,使用阿拉伯语字母的如维吾尔文,使用“十三世纪维吾尔文”的蒙文满文锡伯文(维吾尔族后改用阿拉伯文),有些民族使用自己的表意文字,如彝文还有用象形文字的纳西文(已经不用了)至今没有自己文字的民族都借用了就近的大语种文字

还有就是谚语,但都是用汉字,例如 闽南语,粤语等,还有就是闽南语,粤语等,每个地方都有不同的细微的发音。

朝鲜文

朝鲜族用的朝鲜文是唯一东方自己发明的“纯粹”拼音字母说它是“纯粹”,因为它有表达元音和辅音的完整音素集合音素(phone)是人能分辨的最小语音单位与此相对的是日语的假名,虽然也是拼音文字,但是每个假名表达的是整个音节(syllable)而不是音素朝鲜语在语法结构上最象日语,但是它们的词汇并不相似,所以它们的关系仍有待于进一步研究另一方面,朝鲜语又从汉语借走好多词汇,但在语法结构上又非常不一样有人认为朝鲜最早的居民是一万年以前从北方移入的通古斯人一部朝鲜文字母发明于十五世纪中叶(相当我国明朝前期),共有二十五个字母——字母在哪儿?

你要是仔细看就可以看出,虽然它们看上去象一个个的“方块字”,但每个“方块字”其实是由一些更小的“小零件”组成,这每个“小零件”就是一个字母,它们的种类是有限的,对吗?他们的字母不象其它拼音文字那样排成一条线,而是上下左右错落有致地拼在一个方块内,非常别致懿“眼泪”这个词,它们读作nunmul(nun意为“眼睛”,mul意为“水”),写成从左到右两个“方块字”:

南亚语系

在亚洲的东南部,不是还有菲律宾泿斚罧骉摎烿度尼西亚等国吗,他们的语言是什么样子的?

他们的语言属于马来亚-波利尼西亚语系,又有人把这语系与孟-高棉语系(主要是柬埔寨高棉语)和印度南部的蒙达语系合称“南亚语系”这一系语言横跨了半个地球:东起夏威夷诸岛,西达非洲东南的大岛“马达加斯加”(Madagascar),包括了几乎所有的印度洋和太平洋岛屿(包括密克罗尼西亚軿拉尼西亚和波利尼西亚诸岛,但不包括巴布亚新几内亚和澳洲)。

它包括四种国语:马来西亚语烿度尼西亚语他加禄语(菲律宾语)和马拉加斯语(马达加斯加),总人数有二亿多珿蹑他们的祖先,有人类学家认为是生活在中国大陆东南沿海地区,在公元前二千纪至一千纪之间汉族人开始南侵的同时,他们的航海技术也发展到了一定的水平,开始向海外移居(不知是不是受到了汉族的压力),台湾高山人可能就是他们的后裔在其后的二千年间,他们遍布了如此众多的海岛,占据了如此辽阔的海域,这应当算一大奇迹——尽管他们自己可能倒没意识到有人说,是航海贸易与殖民造就了今日的资本主义,那他们的航海要比西方的“厉害”得多,也早得多,为什么一点儿也没有“发达”的意思?

澳大利亚和巴布亚新几内亚的语言和上面讲到的马来亚-波利尼西亚语言又有很大不同

所谓澳大利亚语言,当然是指生活在那儿的土著居民,白种人们自然是讲英语

今天在澳大利亚的土著人只剩下数万人,可是他们仍在讲数百种语言!对这些语言的研究进行得很不充分,连它们是否属于一个单一的语系也没搞清楚由于澳大利亚自人类出现时就已经成为一块独立的陆地,所以,所谓的“当地土著”,肯定也是什么时候从其它地方迁来的澳大利亚本地的哺乳动物都是非常原始的有袋类,离进化到人类还差十万八千里现代许多人类学家认为当地人是新石器时代某个时候从马来亚——印度尼西亚渡海而来,可这还没有找到足够的语言学方面的证据支持(其它方面可能有证据,我不清楚)今天,许多当地的语言都面临绝灭,可怜它们作为历史的遗迹只在英语中留下了象kangaroo,koala等少数几个词汇

在巴布亚新几内亚的情况与此相似:三百多万人说着五淿繑种语言,从这不难想到,有些语言肯定只有很少的人使用,有的可能只有一个村子,甚至一个家庭邻村的人可能互相都听不懂,许多人尚生活在石器时代所有这些给独立后的政府提出了很大的难题:不可能找到一种(甚至几种)当地语言作为官方语言来发号施令所幸的是,在几百年的殖民统治以后,当地土著居民发明了一种叫“洋泾浜英语”的交流工具,它取得了官方语言的地位

皮钦英语

洋泾浜”是俗称,正式的称呼是皮钦英语(Pidgin English)

“洋泾浜”一词来自上海原来的一条河,就是现在的延安路叿时在上海英租界也有自己的“洋泾浜英语”,“假洋鬼子”们常说“let me seesee”(让我看看)或“no can do”(不能做)这样不伦不类的话所谓皮钦语言就是指一种外来语言被当地人大大地简化了语法和词汇以后用作交流工具,这种现象在不少殖民地都有巴布亚新几内亚的皮钦英语约有1500个词和非常简单的语法,这使它很容易学会而且许多词汇还是由一些更基本的词汇组成的复合词,如“house cook”意为“厨房”,“house sick”意为“医院”,“house paper”意为“办公室”等等另外“belong”变成了一个常用词,仅表示“of”的意思,如“glass belong look-look”意为“镜子”,“smoke belong ground”意为“灰尘”,“lightbelong cloud”意为“闪电”,“man belonglong-way place”意为“外国人”……但是,你可不要以为凭自己的英语可以去那儿独闯天下——他们不会听懂你的英语,你也读不懂他们的“英语”,因为毕竟语法和词汇都有许多变化

亚非语系

亚洲的语言还有一个极重要的成员尚未提到,这就是所谓的“亚-非语系”,传统上叫做“闪米特-含米特语系”,简称“闪-含语系”这名字取自圣经中诺亚的两个儿子,一个叫Shem,一个叫Ham髿-非语言分布于北非东北非近东中东和中亚的广阔地域,包括有二亿多人口和几十个国家

然而,亚-非语言之所以重要,原因还不仅限于此那里不仅是世界上最古老文明的发源地,起源于那里的拼音文字,更是当今世界上大多数主要文字的鼻祖

亚-非语言中的阿拉伯语人口也占了将近四分之三盿荑荛重要的语种还有:以色列的国语希伯来语索马里语翿庉/尼日利亚的主要语言豪萨语,以及非洲北部的一些其它语言

阿拉伯语是将近二十个国家的国语,另外全世界的穆斯林都多少懂几句阿拉伯语,这使它在1974年成了联合国的第六种工作语言菿葛坶母系统更是被许多其它语系的语言所采用菿葛蝶坥保留了几个古代拼音文字的特点:从右到左的书写,以及只有辅音字母没有元音字母还有一个现象是一个字母在词中的位置不同,写法也不一样苿鱙恧在用X窗口的电脑,可以试试看把编辑器的字体设置成阿拉伯文的字母,再看看把同一个字母放在词中间与放在词尾,形状是否一样惿不需要懂得阿拉伯语就能看得出来

阿拉伯文共有二十八个字母,都表示辅音由于它们都写成草体连书,所以看上去一串串的,好像看不出一个个独立的字母那元音呢?你可能还注意到在这些弯弯曲曲的连续曲线的上下还有不少小点点和短线条什么的,那就是元音!

不幸的是,他们阿拉伯人在书写一般文字时,是省略掉这些元音的,只有在小学课本和给外国人看的读物上才注上元音举个例子,要写“solid”这个词,他们大概会写作“dls”(别忘了是从右往左写),那你就很难猜这是个什么词了……

阿拉伯文的古老特点是与近中东文字的起源演变相联系的古埃及和“两河流域”是世界上最先出现文字的地方,也是拼音字母的发源地

大约在五千五百年以前,埃及就出现了文字和书写的纸草约公元前3100年上下埃及统一,统一后的埃及开始有文字记录可考(这比我国开始有文字记载早了一千七百年)最早的文字是图形文字,后来有些文字逐渐变成音节符号和指意符号,其后又有了一音一符的字母,共二十四个所有字母都只标辅音不标元音各种符号组成词组,共有六百多个词组经历这些发展的古埃及文字,是用字母音符和词组组成的一种复合文字到第八王朝(大约在公元前2200)时期出现了一种草书体,到中王朝(公元前2000-1700年)时草书体已广泛流行,只有正式文体和铭刻才用象形体

所谓纸草下埃及产的一种植物,将其茎干剖为长条后,彼此排齐连成片,然后压平晒干成纸这种纸草后来成为古代地中海地区一种通用的纸,希腊人埿汿人以及往后的阿拉伯人都曾用它书写(不过,这还不能算是“正式的纸”,因为“正式的纸”必须等到三千年后由中国发明:-))

早在五千五百年前差不多与埃及人同时,生活在幼发拉底河与底格里斯河(希腊人称为Mesopotamia——美索不达米亚,意即“两河之间的地方”)的苏美尔人(Sumerian)也有了自己的文字他们最早的文字也是图形符号,一符一义以后发展为表音符号和指意符号,一起组成词组自从有了表音和指义符号,字符孳乳增繁的倾向减少,到了约四千三百年前,字符减少到了六百以下,其中约有一百个是表示音节的符号,但是没有单独表示辅音的符号这种文字用削尖的芦杆骨棒等刻写在泥版上,晒干或烘干后成为可以长期保存的文书,有一些保存到了至今,并被释读成功芦杆刻成的笔画,起划粗而深,收划细而浅,形如楔形,因而得名“楔形文字

楔形文字后来成为近东各国外交的通用文字,一直到先进的腓尼基拼音文字的“传人”阿拉美文(Aramaic)流行以后才逐渐弃而不用阿拉美文在近东各国的通行到了公元七世纪阿拉伯的伊斯兰文化兴盛时,又让位于阿拉伯文,直到今日

腓尼基拼音文字是怎样发明的?

腓尼基人在公元前1500年时居住在以色列黎巴嫩一带叿时埃及和两河流域的文字早就有一部分发展为音节符号,埃及文字还由此出现标示辅音的二十四个字母但是两种文字中都有好几百个字符,埃及文字还保持象形体,结构复杂,使用不便地处使用这两种文字的人之间的腓尼基人受到它们的共同影响,取埃及文的辅音符号而摈弃其象形体,发明出了二十二个辅音字母从此文字不再为祭司所垄断,从而避免了玛雅文化那样的命运

与此同时的希腊人,正彷徨于早期从埃及学来的象形-表音混合文字中,到了公元前一千年时,腓尼基文字传入希腊,他们马上放弃了原有的文字,并且又在此基础上进一步发明了元音字母,世界上第一套完整的拼音文字终于诞生了

腓尼基人的字母系统,是对人类文明的重大贡献

拼音文字的优点在于它的普及性一般来讲,学会二三十个字母,就能见字读音蟿坥诅复杂,掌握的人就越少,这对于社会文明的进步非常不利就文字的复杂程度而言,以象形文字为最,其次为表意文字,形声字又次之,拼音文字最简单到了信息时代,拼音文字因其一维的表达方式又有了一个新的优势。

但同时,拼音文字也有一个大问题,就是许多拼音文字,由于千百年来口语的不断变化,它的书面文字与读音往往相去甚远拿法语来说,它的书面语言表达的还是四铿繎瑶以前的发音,不发音的元音比比皆是,象hommes读为um,aiment读为em这就是为什么上文说“一般来讲”

印地安人来自亚洲大约在二万五千年前有一些亚洲人就开始跨过冰封的白令海峡,逐渐向美洲内地迁移这似乎不是有目的的移居,所以这过程缓慢得在一代人中间都看不出来但是到了十六世纪西班牙人到达美洲时,他们已经布满了整个美洲大陆,从阿拉斯加到智利南端的合恩角满っ计那时的人口在一千四百万到四千万之间,操一千七百多种语言,所处的社会形态从狩猎和采集的石器时代到具有高度文明的阿兹台克(Aztec)鯿雅(Maya)和印加(Inca)国家都有

由于人们认定印地安人来自亚洲,所以自然地把他们的语言和各种亚洲语言作比较比较的结果,不仅没有找到确定的联系,而且他们内部也不是完全彼此相象的这说明,第一,二万多年的漫长时光对于语言的变化来说是太长了,我们已知的这些语言之间的联系都仅限于数千年的分离;第二,印地安人不是在同一时刻一起来到美洲的,互相之间可能分属不同的民族

在印地安人中,玛雅人的文字系统是最发达的,玛雅人在公元最初的几个世纪中就发明了文字,符号与解释符号的图形并列,包括很多图形,也有音标和音节符号这些图形文字看上去极其复杂,好像是一幅幅精致繁复的装饰图案

西班牙人征服玛雅后,大部分文字记录都被销毁,只有极少数保存到了今天

这给释读造成很大困难不过释读研究已取得进展,只可惜文字资料太少,我们对于当时社会情形不能了解很多了

在玛雅,只有祭司才识字(所以当他们被消灭干净以后就没人能懂玛雅文了!)

,因此祭司们拥有极大的权力,这导致了玛雅人登峰造极的拜神狂热:修建巨大的神殿和祭坛,频繁而繁缛的祭奠仪式,征用大量的人力物力,甚至把最健壮的人用作牺牲结果,社会生产力遭到很大破坏,加上当时加勒比地区风暴频繁,到西班牙人来到时,各城市已经荒凉破败了……

非洲语言

“非洲”,指的是撒哈拉以南的“黑非洲”,北非和东北非我们已经在讨论亚-非语系时提到过了,他们的语言即便不是阿拉伯语的话,也是它的近亲

非洲有好几百种语言,除了亚-非语系以外,还有尼日尔-刚果语系(Niger-Congo)乍得-尼罗语系(Chari-Nile)科依散(Khoisan)和另外两个小语系盿中最大的一个语系要数尼日尔-刚果语系,有二亿多人口,接近非洲人口的一半,覆盖了撒哈拉以南的广大地区尼日尔-刚果语系的一个最重要分支是班图语(支),人口占了全语系人口的一半以上从西非的喀麦隆到东非的肯尼亚,可划一条“班图线”,班图语就分布在在这条线以南,同时这条线以南的非洲只有一小部分彼此孤立的地区讲其它语言

语言学研究的结果表明,持班图语言的民族最开始是发源于二千多年前的喀麦隆,也就是班图语言区的最西北角可能是因为他们从近东地区学会了种植某种农作物后,由于这种作物的适应性,他们随之逐渐朝东埿迁移,最终布满了由此往南的整个非洲大陆

班图语言中最重要的语种是斯瓦西里语(Swahili),它现在已成为东非最通行的语言,坦桑尼亚肯尼亚更以它作为官方语言

在南非(共和国),白人讲的语言叫“阿非利肯斯语”(Afrikaans)

,这是十七世纪的荷兰殖民者带来的,由于好几个世纪的分离,它已经和荷兰语有了不小的差别,所以把它们看作两种不同的语言;黑人讲的语言主要是祖鲁语(Zulu)和科萨语(Xhosa),科萨语受附近的一个小语系影响,有一种非常难发的“倒吸气”音:一边吸气一边把舌头上下颤动——你要能象这样发出声音我就服你“xh”表示的就是这种音

在现代非洲,和世界上的其它地方一样,较少数人讲的小语言逐渐让位于少数几种大语言因为对每个人来说,放弃自己的不通用的母语而讲邻近的多数人讲的主要语种,自然对生活会更有用些

国际语系

各国语言的差异成为人们互相交往的一个不可克服的障碍。古往今来,人们就渴望有一种共同语言。特别是在信息化的今天,更需要有一种国际通用的语言,实现人们的互相交流。第一个在国际上获得较大影响的人造语,是由德国教长施莱耶(Schleyer)于1879创造的沃拉普克语(Volapuk)。 1887年波兰人柴门霍夫创造世界语(Esperanto)。世界大同语(Mondlango)。除了沃拉普克语,大同语和世界语之外,其它影响较大的人造语还有:伊多语(Ido),西方语(Occidental),诺维亚语(Novial),英特林瓜语(Interlingua),格罗沙语(Glosa),欧盟语(Atlango)等。

消亡

语言是文化的有机组成部分,又是文化的载体,世界文明的多样性在很大程度上表现为世界语言的多样性。德国知名学者威廉·冯·洪堡曾经说过:“每种语言都反映了一个民族的精神和智慧。”但是多种语言共存的局面正逐渐被打破,据语言学家推算,公元前地球上曾有12000种语言存在,公元元年时降为10000种,到15世纪时减少到9000种,而如今只有6820种左右。有专家测算,今天人类语言种类的消亡速度是哺乳动物濒临灭绝速度的两倍,是鸟类濒临灭绝速度的四倍。据专家估计,世界尚存的语言,在21世纪将超过一半消亡;200年后,90%以上的语言将不复存在。

在联合国教科文组织绘制的《全球濒危语言分布图》上,印度共有196种语言濒临灭绝,是濒危语言最多的国家;排在第二位和第三位的国家分别是美国和印度尼西亚,濒危语言数量分别为192种和147种。这是人类历史上第一次用“语言地图”的形式,向人们直观地展示了全球部分族群的濒危母语现状。图上列出了2474种语言的名称、濒危程度和使用地区,其中有230种语言自1950年起已经消失。在母语遗失方面,澳大利亚是全球最为严重的国家。在澳大利亚人的语言遗产中,有95%已消失殆尽——在殖民运动之前,澳大利亚大概有250种语言,加上方言,共有700多种,如今却只剩下不到50种。

中国虽然不在全球语言濒危的热点地带,但是至少也有数十种语言处于濒危状态。联合国教科文组织将东北地区、陕晋黄河中游地区和西南边境地区列为中国濒危语言最集中的地区。据中国民族语言学会名誉会长孙宏开介绍,有几种少数民族语言已经处于完全失去交际功能的状态,如满语畲语赫哲语塔塔尔语等;有20%的语言已经濒危,如怒语仡佬语普米语基诺语等;40%的语言已经显露濒危迹象或正在走向濒危。比如,云南的子君语也只有十几个老年人会说;这些老年人辞世之时,也将是子君语退出历史舞台之日;子君语已被联合国教科文组织列入中国的“极度濒危”语言之一。

语言濒危是一种全球现象,但是却值得所有人关注。保护民族语言和抢救濒危语言就是为了保护多样性的民族文化,同时也是为了保障各民族成员的平等权利。这正如中国知名学者周海中曾经指出的那样:一些民族语言正面临着全球化、工业化、互联网等的冲击,正处于逐渐消失的危险,有关部门、机构以及语言学界都应该采取积极而有效的措施来保护弱势的民族语言和抢救濒临灭绝的民族语言;这样既有利于人类文明的传承和发展,也有利于民族团结、社会安定。

投稿
非常不爽,删了吧! 相关词条:文化 语言文字 专业术语 世界语言 泰语 缅甸语 斯瓦希里语 波利尼西亚 印度尼西亚语 泰米尔语 土耳其语 越南语 阿布哈兹语 希利 亚非语系 阿坎语 阿卡德语 阿留申群岛 阿姆哈拉语 阿帕切语 阿拉米语