汉语与汉字
漢語與漢字
漢語簡介
漢語,指漢民族的語言,又稱中文、國文、國語、華文、華語,屬於漢藏語系,屬分析語,有聲調。漢語的文字系統漢字是一種意音文字,表意的同時也具一定的表音功能。
一般意義上,「漢語」這個詞,多指現代標準漢語,以北京語音為標準音、以北方話為基礎方言、以典範的現代白話文著作為語法規範。[1]在中國大陸漢語語言文字課本中稱為語文。需要注意的是,中國大陸之「普通話」、台灣之「國語」、新馬地區之「華語」,在取音上是有一定程度的差異的,亦有一些漢字的讀音在三者中根本不同。而大部分非中國大陸的學者認為,漢語是眾多漢方言的統稱,是一個稱謂,可以指代任何其中一種方言(如粵語、吳語、客家話……),而非單一是語言。
漢語是聯合國規定的六種正式語言之一,亦為當今世界上使用人數最多的語言,也是目前學習人數增長最快的語言。在中國大陸和台灣,漢語被定為官方語言。
漢語從口語上來說其各分支相似性極低,可類比羅曼語族各語言。因此有不少西方語言學家據此將漢語視爲一個語族(漢語族)。而從文字、使用者(漢族)、政治、文化的統一性的角度來看,大部分中國學者認為漢語是個語言。中國大陸和台灣以現代標準漢語為通用語言。廣東、香港與澳門以粵語作為通用語言。境外華人多以粵語為通用語,亦以現代標準漢語、客家話、閩南話或其他漢語方言作為社區交際通用語言。
漢語作為以表意文字為文字系統的語言,文字高度的統一與規範,現代漢語有統一和規範的語法。但是漢字在表音上面並不直接而確切。在漫長的歷史時期內,漢字的讀音發生了巨大變化,並導致方言發音差異特別大。但是漢語書面語言規範,減少了因為方言差異造成的書面交流障礙。
白話文運動之前所使用的書面語叫做「文言」,是一種以上古漢語所使用的以「雅言」為基礎的書面語。白話文運動之後所推動的書面漢語通常被稱為「白話」,即以北方官話為基礎的現代書面語。在現代漢語的書面語中,文言已經很少使用了。
漢語的地域分支
方言與語言
漢語口語在不同地方的分歧是相當大的。從大的範圍上說,如北京話、上海話、
廣州話等完全無法互通;從小的範圍上說,漢語(尤其在中國大陸南方)「十里不同音」,浙江、福建甚至出現一個縣有十數種不同口音的現象,即使在號稱「相對統一」的北方方言內部,亦因為地域不同而存在較大的口音差異。但漢語又具有文字(書面語)和使用者(漢族)的高度統一性,這與世界上的大多數語言的情況是完全不一樣的。
獨立語言與方言的區別劃定,除考慮語音上的通話度外,語音上的源流、語法、詞彙、書寫系統,以及東西方對「由文致語」或「由語致文」的認識差異,甚至使用者的認同感、政治因素,都是很重要的判斷依據。因此,關於漢語是單語還是多語合集的問題,基於語言學特徵的不同側重點,或者僅基於不同的政治訴求,其回答可能會並不相同。目前中國大陸多數漢語使用者還是認為不同地域的漢語只是漢語不同的方言[來源請求]。
總體而言,在語言學者中,中國大陸的學者較多地使用「方言」一詞指稱相互有差別的漢語1,而大陸以外的學者,部分人認為漢語內部只存在方言,部分人則認為漢語內部可分解成多種獨立的語言;在操漢語的非語言學人士中,受到漢語詞彙、漢字以及中國大陸官方對主流學術觀點宣傳的影響,多數人都用「方言」來指稱相互有差別的漢語。這是一種非常籠統的稱呼,幾乎完全忽略語言距離的大小,甚至跟口音的概念相混淆。在中國以外,有不少語言學家主張將漢語視為一個包含一組親屬語言的語族,這種觀點也得到中國國內部分學者的支持。 在一些語言學的中文2出版物中,確實存在「漢語語族」或「漢語族」的說法。不過這種說法僅見於諸如介紹漢藏語系的總概中,並沒有專門的論文來討論。事實上,儘管語言學界對漢藏語系的構成有爭論,但都同意將漢語定為漢藏語系之下的相當於「語族」的地位。雖然這種分類意見得到絕大多數語言學家的贊同,但在具體細分上仍然存在尖銳的對立觀點。一種觀點認爲,漢語和漢語語族只是形式上的差別,漢語族只含一個語支即漢語支,漢語支下只含一個語言即漢語;另一種觀點認爲,漢語族下包含若干個語支,各語支下包含若干語種,各語種包含若干方言。
瑞典著名漢學家高本漢(Bernhard Karlgren)在其著作《中國音韻學研究》中將朝鮮語、日本語、越南語等其他語言稱作漢語的「域外方言」。這是作者在漢語研究的特殊條件下為貫徹歷史比較語言學的方法而採用的比擬性質的簡便說法,並不意味著作者當真認為這幾種語言也屬於漢語。目前世界上絕大部分使用或接觸過這些語言的人也不會把這些語言當作漢語的方言,儘管這些語言當中存在大量漢語借詞。
漢語的分支
漢語所包含的語言種類問題,在語言學界頗有爭議。目前有兩種不同的觀點:一種觀點認為漢語只包括漢語一種語言;另一種認為漢語包括閩語、粵語、客語、吳語、贛語、湘語等語言。中國國內的學者多數支持前者,而中國以外尤其西方
多數學者從語言學的角度支持後者。支持後一種觀點的人認為漢語不是一種單一的語言,而是一簇相互關聯的有親屬關係的不同語言。支持前一種觀點的人則將閩語、粵語、客語、吳語、贛語、湘語等列為漢語方言,例如趙元任認為標準語(普通話)是方言,閩語、粵語等也是方言[2]。然而實際上,習慣上所稱的「漢語方言」相互之間或與標準漢語之間無法互通,語言距離往往比歐洲同一語系之下的各種語言之間還要遠。例如一個只會西班牙語的人可能可以使用西班牙語和另一位只會葡萄牙語的人勉強達成溝通,但一個只會粵語的人和一位只會贛語的人對談時,是完全聽不懂對方在說什麼的。
中國國內語言學家根據漢語分支的不同特點,把漢語劃分為傳統的七大方言。在這七大方言內部,仍存在不同的次方言區。有時這些次方言區內的使用者也不能相互理解。在不同的方言區的人的語言意識也有一定的區別。例如,一個使用粵方言的香港人可能會感到與操臺山話的廣東人有很多共同點,雖然他們可能不能相互理解。
在地理上的方言分歧也是很明顯的。在華北官話、西北官話或者西南方話地區,相隔幾百公里的人一般可以相互口頭交流,但某些地區語音和詞彙的變化也是很大的;然而在中國南方的許多地區,尤其是山區,較小地理範圍內可能存在相互口語交流困難的方言。擧一個極端的例子,如福建某地,相隔只有十公里的當地居民也許已經不能自如口頭交流了。
漢語方言官話
漢語方言官話,或稱官話方言等:指華北、東北及西北地區、湖北大部、四川、重慶、雲南、貴州、湖南北部、江西沿江地區、安徽中北部、江蘇中北部所使用的母語方言。官話大致分為華北官話、西北官話、西南官話、江淮官話,華北官話分佈在北方東部,以北京話為代表,西北官話分佈在北方西部,以西安話為代表,西南官話分佈在南方西部,以成都話為代表,江淮官話分佈在南方東部,以揚州話為江淮話的代表。上古時期的中原雅音在五胡亂華、衣冠南渡後,分化成為中古漢語語音。而現代「官話方言」,主要形成於宋元時期。官話在形成之後,在南北方分別發展,由分化成了南方官話和北方官話,為以後中國各代的官方語言,北方官話至今是現代標準漢語的基礎(大陸稱為普通話,臺灣稱為國語)。使用這一方言的人占中國人口的70%。
需要指出的是,「官話方言」,過去曾經稱為「北方方言」,並不局限於中國北方。相反,中國西南地區和江淮地區的南方方言也屬於官話方言。
官話的明顯特點包括:失落了全部中古入聲,中古漢語中的「-p,-t,-k,-m,-n,-ng」韻尾現在只剩下「-n,-ng」,但出現了大量兒化韻「-r」韻尾。原本連接「i,ü」韻母的「g,k,h」聲母已被顎音化成「j,q,x」聲母。官話話在失去清濁對立的過程中,沒有經過劇烈的聲調分化,但出現了中古平上去入以外的輕聲。因此,官話方言包含了大量的同音字以及相應産生的複合詞。上述現象在其他方言中比較少見。
吳語
吳語,或稱吳方言:在中國江蘇南部、安徽南部、上海和浙江大部分地區使用。典型的吳語以蘇州話為代表。其中安徽西南部受贛語影響,浙江南部保留了較多古代百越話特徵,以至不能和作為典型吳語的太湖片吳語通話。使用人數大約為總人口的8.4%。這種方言的對清濁輔音的區分是一個很明顯的特點。但吳語保留了中古漢語的模糊入聲。
客家話
客家話,或稱客語:在中國南方的客家人和絕大多數畲族人中廣泛使用,包括廣東東部、北部、福建西部、江西南部、廣西東南部等地,以梅縣話為代表。雖然是一種南方方言,但客家話是在北方移民南下影響中形成的。客家話因而保留了一些中古中原話的特點。使用客家話的人口大約占總人口的5%。客家方言的特點是平聲,上聲不分陰陽,但入聲,去聲分陰陽。
閩語
閩語,或稱閩方言:在福建、海南、廣東東部、台灣、菲律賓、新加坡、馬來西亞還有其他海外的一些華人中使用。由於閩語的內部分歧比較大,通常分為閩南方言(以廈門話為代表)、閩北話、閩東話(以福州話為代表)、莆仙方言和閩中方言。閩語是所有方言中,唯一不完全與中古漢語韻書存在直接對應的方言,其中以閩南語最具影響。但是,根據現有的語音學研究,閩語的音系相當接近上古漢語的音系。
閩南語
閩南語(狹義的,即閩台片閩南話)共有「-m,-n,-ng,-p,-t,-k,-ʔ」(貌似問號的國際音標是緊喉音。)在入聲 [-p/-t/-k] 消失之前,先發生『入聲弱化』,[-p/-t/-k] 全部變成 ʔ。山西方言仍保有這種弱化入聲)」七種輔音韻尾。閩南語是漢語中聲調較複雜的方言之一,泉州音有8個聲調(不含輕聲),漳州音、廈門音、同安音、台灣音通常有七個聲調(不含輕聲)。同時,閩南語也是保留中古漢語最完整的方言之一。泉州音和漳州音是其它支系的母語,閩(南)台片的閩南語內部較為一致。廣義的閩南方言還包括海南話、潮州話、浙南閩語等,使用閩南語的人口大約為總數的4.2%。
粵語:以廣州話為代表,在廣東廣西的部分地區、香港、澳門和海外華人中被使用。粵方言是漢語中聲調最複雜的方言之一,有九個聲調(桂南勾漏片有十個聲調)。同時也是保留中古漢語最完整的方言之一。粵語包含了p,t,k,m,n,ng六種輔音韻尾。粵語內部的分歧不大。使用粵語的人口大約為總數的5%。但是粵語中沒有混合入聲,可以認為粵語中保留的古漢語成分要早於吳語,但晚于閩語。
湘語
湘語,或稱湘方言:在湖南使用。按是否保留濁聲母分類,可分為老湘和新湘兩類,其中濁聲母已全部清化的新湘語相對接近西南官話。分別以長沙話(新)及雙峰話(老)為代表,使用者約占總人口的5%。歷史上湖南湖北兩省受到北方
文化的強烈影響,故湘語內部差異比較大。並且有多個時期古漢語語音特徵之重疊。
贛語
贛語,或稱贛方言:以南昌話為代表,主要用於江西大部、湖南東南部。使用人數約為4800萬,早期的2400萬不夠精確。贛方言在音系上與客家方言十分接近,因此學術界有將贛客方言統一歸類的提議。
有爭議的方言
下面的幾種方言是否構成獨立的大方言區,現在尚有爭議:
晉語
晉語:在山西絕大部分以及陝西北部、河北西部、河南西北部、內蒙古河套地區等地使用,以太原話為代表,有入聲韻—— [-ʔ](這貌似問號的國際音標是緊喉音。在入聲 [-p/-t/-k] 消失之前,先發生『入聲弱化』,[-p/-t/-k] 全部變成 [-ʔ])。其白讀系統與官話截然不同。以前(及現在的不少語言學學者)將其歸於官話。
平話:在廣西的部分地區使用。傳統上將桂南平話歸於粵語,近年來有人主張將桂北平話當成孤立的土語存在。
徽語
徽語:在安徽南部及贛浙蘇部分毗鄰地區使用。以前(及現在的部分語言學學者)將其歸於吳語。
漢語聲調
漢語的聲調,在漫長的歷史時期中不斷的分化組合。在學術界,通常以「平上去入」四聲作為基本聲調分類。在平上去入四類的基礎上,加上陰,陽,上,下等形容詞作為清濁的標記。例如「陰入」,「陽入」,意為「清入聲」和「濁入聲」。其他以此類推。
漢語聲調的變化,是推斷古漢語語音的一個重要語音學證據。現存各方言中的聲調調類和調值,也是推斷此方言保留繼承了那一歷史時期的古漢語語音的最重要的語音學證據。上古漢語的聲調,現在學術界比較傾向於王力的「促舒四調」一說,舒聲調有平聲,上聲,濁聲調為長入,短入。隨後在兩漢時期,去聲大量從「濁上」這一聲調中轉化出來,被稱為「濁上變去」。在魏晉南北朝期間,漢語四聲穩定為「平上去入」四聲,但具體清濁調值則尚未研究清楚。此後,「平上去入」四聲作為漢語的標準四聲規範,一直沿用到宋元時期。
入聲通常以-t,-p,-k,為輔音結尾。但在宋代,三種輔音結尾開始界限模糊,出現了混合入聲。隨後在元代,官話方言逐漸形成,入聲在華北等地的官話方言中消亡。但是同時期的南方方言和一些官話方言在南方地區的次級方言,仍然保留了入聲。
到了明清,入聲消亡的情形在北方地區進一步加劇,並且「平聲」逐漸出現了清濁之分,是為「陰平」和「陽平」。到了現代,以北方方言為基礎的大陸地區「普通話」,台灣地區「國語」,馬來西亞和新加坡的「華語」。均沒有入聲。但是,這三種官方語言的聲調為「陰平,陽平,上聲,去聲」,仍然為四聲。但是,此「四聲」並非中古漢語「四聲」。
漢語各方言可從其聲調的類別和入聲的存在和消亡程度粗略的推斷出其保留了哪一時期的古漢語音韻結構。其中,閩語-t,-p,-k,和模糊入聲都有,證明閩語歷史上受到不同時期漢語音韻的多次重疊覆蓋。粵語中只有-t,-p,-k,沒有混合入聲,但卻保留有極少見的「長入」「短入」之分。可認為是較多的保留了上古並中古漢語音韻,更側重於中古漢語。吳語、贛客語和湘語都只有混合入聲。「官話方言」絕大多數次級方言都沒有入聲,學術界基本認定「官話方言」形成於宋元之後。
漢語書面語
文言文和白話文都是漢語的書面語。白話文運動之前所使用的書面語叫做「文言」,是一種以孔子時代所使用的以「雅言」為基礎的書面語。白話文運動之後所推動的書面漢語通常被稱為「白話」,即以北方官話為基礎的現代書面語。在現代漢語的書面語中,文言已經很少使用了。
語言的特點也不是純粹用時間作標準就可以劃分開的,比如宋元人的一些筆記小說,以及後來的一些白話小說,跟現代漢語很相似,但同正式場合使用的文體不同。同樣的,就在白話文運動以後,一些官方文書和文藝作品仍然採用文言文文體,另一些作品則介於兩者之間。
漢字
漢字是漢語書寫的最基本單元,其使用最晚始於商代,歷經甲骨文、大篆、小篆、隸書、楷書(草書、行書)諸般書體變化。秦始皇統一中國,李斯整理小篆,「書同文」的歷史從此開始。儘管漢語方言發音差異很大,但是書寫系統的統一減少了方言差異造成的交流障礙。漢字的書寫也不盡相同,所以出現許多異體字,還有歷朝歷代規定一些避諱的漢字書寫(改字,缺筆等),但一般不影響閱讀。
東漢許慎在《說文解字》中將漢字構造規律概括為「六書」:象形、指事、會意、形聲、轉注、假借。其中,象形、指事、會意、形聲四項為造字原理,是「造字法」;而轉注、假借則為用字規律,是「用字法」。
三千餘年來,漢字的書寫方式變化不大,使得後人得以閱讀古文而不生窒礙。但近代西方文明進入東亞之後,整個漢字文化圈的各個國家紛紛掀起了學習西方的
思潮,許多使用漢字國家即進行了不同程度的漢字簡化,甚至還有完全拼音化的嘗試。日文假名的拉丁轉寫方案以及漢語多種拼音方案的出現都是基於這種思想。中國大陸將漢字筆劃參考異體字行書草書加以省簡,於1956年1月28日審訂通過《簡化字總表》,在大陸及新加坡使用至今。台灣、香港和澳門則一直使用傳統漢字(亦稱繁體中文)。
正體及簡體書寫的「漢字」漢字,是漢字文化圈內使用甚廣的一種文字,屬於表意文字書寫系統的詞素音節文字[1],漢字為上古時代的華夏族人所創製,可追溯至約公元前1300年商朝的甲骨文,到秦朝的小篆,發展至漢朝才被取名為「漢字」,至唐代楷化為今日所用的手寫字體(楷書)。中國歷代皆以漢字為主要官方文字,現時分別為中華人民共和國與中華民國定為國家規範用字,又被外國人稱為中國字(Chinese)。漢字在古代已發展至高度完備的水準,不單中國使用,更在很長時期內充當東亞地區唯一的國際交流文字,二十世紀前還是日本、韓國、朝鮮、越南等東亞和東南亞國家官方的書面規範文字。
現代漢字,在中文體系大致分成繁體中文(或稱正體中文)與簡體中文兩個體系。前者主要用於臺灣、港澳地區以及歐洲和北美的早期華人移民與八十年代以前的新加坡、馬來西亞,而後者主要用於中國大陸、東南亞的華人以及八十年代之後的新加坡、馬來西亞,一般來講,繁簡兩個體系的使用者都能在短期內適應並能看懂另一體系的文字。日本和南韓則是另行各自製定了官方的漢字使用規範,但漢字在越南和北韓已不再具有官方規範地位。
字源
漢字一詞早出自《北史》卷九本紀第九,「章宗一」:「十八年,封金源郡王。始習本朝語言小字,及漢字經書,以進士完顏匡、司經徐孝美等侍讀」。《金史》也出現多次,如:「女真初無文字,及破遼,獲契丹、漢人,始通契丹、漢字,於是諸子皆學之」。 「長子布輝,識女真、契丹、漢字,善騎射」。在清朝前期,政府官方文字是滿文,當時已用漢字一詞稱呼中國傳統的文字。更之前的古代中國,因為沒有與他國區分的必要,多稱呼為「字」或「文字」。
直到目前為止,臺灣官方文字相關政策制定的中華民國教育部,以定義官方文字的「國字」作為稱謂,而不使用其他國家使用的漢字一詞,例如《國字標準字形表》等。民進黨執政時期曾有意更名「漢字」,但遭媒體及部份人士批評為「去中國化」的一環而作罷。另外,日本人也稱呼為「漢字」,以別於由漢字衍生的假名。在南韓,漢字則與訓民正音(諺文)相區別。
漢字的特點
漢字的特點有以下幾項,字根組字:以本身即有意義的869個聲母及265個形母
的象形、指事字為最基本字根部件,稱為「字源」,通常為獨體字,例如「日」、「月」,可組成各種複合部件(如「明」,可再堆疊組合成漢字盟、萌、曌等字)、以及一般認知的字(「明」本身就是一個字)。《參考漢字的字形與編碼第三頁》 表意:承上,字根本身表義,多個字根合成新義,且空間的配置對字義有影響。 相容並蓄:各語言、各領域應用可以六書基本規則,可貼近自身領域、地域所需組出所需要之字。 書同文:漢字本身不完全表音,不同方言、甚至語言,仍可書同文,以文意、字義來互相瞭解。 獨有的文化如對聯、書法藝術等。
漢字的歷史
甲骨文漢字是世界上最古老的三大文字系統之一。其中,古埃及的聖書字、兩河流域蘇美爾人的楔形文字已經失傳,僅有中國的漢字沿用至今。傳說中,漢字起源於倉頡造字。黃帝的史官倉頡根據日月形狀、鳥獸足印創造了漢字。從歷史角度來看,複雜的漢字系統不可能由一個人發明,倉頡應該是在漢字的蒐集、整理、統一上做出了突出貢獻,所以《荀子‧解蔽》中記載「好書者眾矣,而倉頡獨傳者,一也」,而漢朝淮南子一書更描述倉頡的貢獻為「天雨粟,鬼夜哭」:描述文字的發明有如天上降下五穀廣披大眾,使得資訊透過文字能傳載給任何人;而倉頡之前已去逝的人(鬼)都痛哭沒有辦法享用到文字的好處。有觀點認為《周易》中的八卦對漢字形成有較大影響,但支持者甚少。
原始文字
文字發明前的口語知識在傳播和積累中有明顯缺點,原始人類使用了結繩、刻契、圖畫的方法輔助記事,後來用特徵圖形來簡化、取代圖畫。當圖形符號簡化到一定程度,並形成與語言的特定對應時,原始文字形成。1994年,湖北楊家灣大溪文化遺址出土了大量陶器,其上170多種符號中,部分特徵與甲骨文有較大類似之處。這一發現將原始漢字的形成過程推定到距今6000年以前。此外,山東大汶口出土的陶器上的象形符號,西安半坡彩陶上的幾何符號,河南賈湖距今8000年前龜甲上的幾何符號賈湖契刻符號等,都可能是原始文字形成中(或形成前)不同階段的表現。但是,商朝以後的漢字和這些幾何符號是否一脈相承?這個問題還在爭議中。許多學者提出,這些符號不一定是漢字的前身,甚至不能絕對肯定是文字元號。
象形指事時代
泰山封禪刻石,相傳為李斯所書從甲骨文到小篆,漢字經歷了從鉅細靡遺描繪意象的方式往簡化成容易紀錄刻畫的方向變遷,字形逐步脫離事物的具體形象。這一時期的漢字也稱為古文字。商周時期的甲骨文已經是一種比較完整的文字體系。在已發現的4500多個甲骨文單字中,目前已能認出近2000字。與甲骨文同期,青銅器上鑄造的文字稱為金文或鐘鼎文,西周時期的《散氏盤》、《毛公鼎》具備很高的史料和藝術價值。
春秋時代開始,各地諸侯相爭,而原本周文化獨尊的局面逐漸破壞,各地區文化開始有"在地化"的改變趨勢。到了戰國時代以後,這種情況更明顯,在文字使用方面可以粗略依照地域分為五大系統:東方齊系、東北燕系、南方楚系、北方晉系和西方秦系文字,各系統的文字大體上相近,只有小部份文字有所差異,因此彼此文書往來並沒有太大問題。
秦始皇統一中國後,李斯在大篆(秦系文字)和六國古文的基礎上,進行規範和整理,制定出了小篆作為秦朝的標準書寫字體,統一了中國的文字。小篆呈長方形,筆畫圓潤流暢。小篆解決了各國文字間出現大量異體字的情況,「書同文」的歷史從此開始。文字的統一有力促進了不同語族間的文化傳播,對中國的統一以及東亞各國的文化交流發揮了重要作用,為世界文字史所罕見。
漢字的發展經歷了許多不同的演變。初期漢字系統的字數很少,以象形與指事的獨體字為主,大量事物以通假字來表示,使文字表述存在較大歧義。例如先秦的「文」,兼有後世的新字「紋」的功能,表示一組成各種事務的規律、型式,不單指文字的文,也包含野獸身上的花「文」、布上面的織「文」、手指的指「文」等數種含意。除了「凹」、「凸」等特例直到唐朝才發明[3],大部分的象形指事字很早就已經定型,成為下個時代形聲會意組字法的基礎。
形聲會意時代
為了能更精準的表述,最早從小篆的時代開始一直到現代,因應隨文明發展不斷增加的新事物,以基本的象形指事字為基礎,發展了形聲、會意的組字法,以組合方式,來細化大量的字出來,使得文書上記載越來越精密,到今天一直為造字的主力。例如:最早海上的交通工具就只有:「舟」一種;但演化到現在,細分成「舨、舟、艇、船、艦」等不同小大規模與形制的「舟」。
一開始金屬只有「金」一種,但隨著冶金技術的發展,對於金屬的知識更加豐富,「金」被細化成「金」、「銀」、「銅」、「鐵」等等。
隋文帝楊堅原為隨國公,但因「隨」字的「辶」有不穩定之意,故去掉「辶」,而造「隋」字作為國號。唐朝和武周時,武則天根據「日月當空」之意而造字「曌」(同「照」字)作為她的名字。同時發明的文字還包括圀、瞾、囝等。人稱則天文字。五代劉龑取「飛龍在天」之意創了自己名字內的「龑」字。
在近代,由於大量西方知識的湧入,也造了許多字。例如隨著「Beer」傳入中國,如何用漢字表達是一個問題,最初譯為皮酒,後覺不妥,於1910年左右創造了「啤」字——譯為「啤酒」。(而在同一時期,朝鮮半島與日本採用了「麥酒」這個名字作為「啤酒」的譯名。)
近代化學名詞在翻譯成中文時,也用了形聲會意造字法,造了一系列的新字,例
如「溴」、「鈽」元素與「醇」基、「醛」基等有機化合物名詞。另外化學上還有很多將兩個字的部分湊合起來表示新的意義的字,其發音也是兩字發音湊合而來。如「烴」(碳氫)、「羰」(碳氧)、「巰」(氫硫)、「羥」(氫氧)等。
為了表示英制的單位,還造了一些多音節的字,如浬(海里)、嗧(加侖)、瓩(千瓦)、呎(英尺)、哩(英里)等度量衡用字。目前在臺灣仍然使用,但多為單多音節混用,港澳地區亦同。不過這些多音節的字在1977年7月20日大陸的中國文字改革委員會和國家標準計量局所發的《關於部分計量單位名稱統一用字的通知》中被淘汰,在大陸地區不使用。
有了造好的象形、指事的獨體字為基礎,使用形聲、會意組字法隨著文明的發展,組出表示新事物的合體字,這使得記載為文時,以前述的各種不同的船來說,只要看一單位的字形,我們就知道指的是那一種「舟」,這樣辨識理解的效率非常高;反過來,以組詞的方式就要看過前後文(或短或長)有其他哪些字才能判斷正確的意義,較缺乏辨識效率,但方便口語溝通(漢字同音字太多,聽覺不易辨識,解法一為組詞,二為如韓日語數音為一字:「浬」發音為海里)。
字體史
小篆筆畫以曲線為主,後來逐步變得直線特徵較多、更容易書寫。到漢代,隸書取代小篆成為主要書體。隸書的出現,奠定了現代漢字字形結構的基礎,成為古今文字的分水嶺。漢代以後,漢字的書寫方式逐步從木簡和竹簡,發展到到在帛、紙上的毛筆書寫。草書、楷書、行書等字體開始出藝術。古代印刷術發明後,出現了用於印刷的新字形宋體,傳入日本,衍生出明體(可能是在明朝傳入。微軟作業系統預設字形,細明體即為之),在現代又陸續出現了黑體、仿宋體等字形。
漢字的語文知識
造字原理
六書是漢字組字的基本原理,在周禮中就有提到了六書,只是沒有說明具體內容。到了東漢,許慎在《說文解字》中,詳細闡述了「六書」這個漢字構造原理:象形、指事、會意、形聲、轉注、假借。前兩項,「造字法」也;中兩項,「組字法」也;後兩項,「用字法」也。這六個原理,是古代文字學學者歸納出來的字學理論。其所含漢字構成法則,是長期演化而成的,不是任何一個人獨創的。
象形
這種造字法是依照物體的外貌特徵來描繪出來,所謂畫成其物,隨體詰詘是也。如日、月、山、水等四個字,最早就是描繪日、月、山、水之圖案,後來逐漸演化變成現在的造型。
指事
這是指表現抽象事情的方法,所謂「各指其事以為之」是也。如人在其上寫作
「上」,人在其下寫作「下」,有人稱為抽象的象形。
會意
這個造字法,是將兩個字根組合起來,使衍生出新的含意。如「日」和「月」組起來,就是日光加月光變成「明」。「人」字和「言」字合成「信」字,意思就是人過去所言;有信,就是這個人都很遵守自己說過的話。
形聲
此乃文字內以特定形狀(字根)表特有的音。例如:胡,這個字也可為一個聲符,結合不同的屬性部件,表不同意義如蝴、湖、葫、瑚、醐等,而以同樣的發音元素(也有的是完全同音),表達不同的事物。但形聲字,也因古今語言音韻變遷,不少古代同類形聲字在今天的官話已無共同音素了,如過、蝸。
轉注
這是用於兩個字互為註釋,彼此同義而不同形,漢代許慎解釋道:「建類一首,同意相受,考、老是也。」,這怎麼說呢?此二字,古時「考」可作「長壽」講,「老」、「考」相通,意義一致,即所謂老者考也,考者老也。詩經的《大雅·棫樸》亦雲:「周王壽考。」。蘇軾的《屈原塔詩》也有古人誰不死,何必較考折。一語。其中的「「考」皆「老」意,特別注意的是,後代的文字學家針對許慎的前述的定義也作了大量的解釋。其中包括「形轉說、聲轉說、義轉說」三類,只是這三種說法有人認為不夠全面,當代古文字家林沄先生也有解釋說「轉注」就是一個形體(字根)記錄兩個讀音和意義完全不同的兩個詞。例如「帚和婦」與甲骨文中的「母和女」等等。
假借
這法簡言之,借用一字,去表達別的事物。一般來說,是有一個無法描述的新事物,就借用一個發音接近或是屬性近似的字根,來表達這個新事物。例如:「又」,本來是指右手(最早可見於甲骨文)[3],但後來被假借當作別的意思。聞,本意是用耳朵聽東西的意思。例如《大學‧第七章》中有「視而不見,聽而不聞,食而不知其味」,但後來被假借成嗅覺的動詞(不過也有人認為這是錯用)。 (其中「轉注」「假借」兩項的意義,至今爭訟不休,尚無令人滿意的說法。)
漢字結構
漢字由一個或以上的字根以二維方式(歐語系是一維文字)在特定的正塊空間內組成,因此有方塊字的別稱。所謂的「文字」,古代是兩個東西,東漢許慎《說文解字》敘:「倉頡之初作書,蓋依類象形,故為之字,其後形聲相益,即謂之文。」;宋鄭樵《象類書》雲:「獨體為文,合體為字」。這個文,現代的術語叫作字根部件,漢字是以意念的表達需要組合所需部件於一方塊,合成千千萬萬的字。
基本字根部件
鄭樵的搜集,以形為主的文有三百三十個,稱為形母,以聲為主的文共有八百七十個,稱為聲母,合計一千二百文。但鄭樵的聲母形母已經失傳,近代周何教授
依據中文資訊交換碼(CCCII)第二集的22394字的字集重新整理的結果,得出漢字有869個聲母及265個形母,共計1134個。形母:鄭樵的搜集,有三百三十個。現代的研究整理,是265個。聲母:鄭樵的搜集,有八百七十個。現代的研究整理,是869個。
特點
單一字內就有很高的訊息密度,在表達同樣的事物時,可比表音文字用更短的篇幅表達同樣的訊息,而且更為精密,鮮需依賴前後文的情境理解某字含意(此指傳統字而言,不適當的簡化字有跟表音文字一樣的情形),所以漢字的閱讀效率很高。 所有漢字乃由1134個字母為基本字根,如金、木、水、火、土、爻、又、心、攵、乂、弋等,像積木一樣組合而成。以意念的聯結組合各種文成各式各樣的字,表達各種意涵。
如不認識一字之意,可拆字,從組成字根以及空間的配置推斷出其字義。當時代演進出現新事物,難以詞的方式來表達或是缺乏效率時,也能以字根組合原則,合成出新字來用,例如:鈾'字,就是近代為了表達新發現的化學元素而新造的字。
漢字組成的字根空間配置對字義有影響:如同樣是「心跟亡」的合體,左右排是「忙」,上下排是「忘」,排列不同,導致不同涵義;文字右邊有「乂」這個字的字根,這表示右手(手的左偏旁表示左手)持某物進行某事(金文、甲骨文考古的發現),如果右手拿斧頭就變成「攵」,有這個字根的,字本義幾乎都是有針對性武力的使用或強制維護一個秩序相關的事物,例如攻、敗、收、散、政、牧、敕、赦、放等字,跟一個秩序的建立消滅、維持有關。[3]。
字形(漢字書法)
「國」這個字的筆畫與筆順漢字有各種不同的書寫方式,即有不同的字體;不同的字體,漢字的字形不一樣。規整的字體(如:楷書、宋體、隸書、篆書等)書寫下的漢字是一種方塊字,每個字佔據同樣的空間。漢字包括獨體字和合體字,獨體字不能分割,如「文」、「中」等;合體字由基礎部件組合構成,佔了漢字的90%以上。合體字的常見組合方式有:上下結構,如:「笑」、「尖」;左右結構,如:「詞」、「科」;半包圍結構,如:「同」、「趨」;全包圍結構,如:「團」、「回」;複合結構,如:「贏」、「斑」等。漢字的基末級部件(或稱基礎部件)包括獨體字、偏旁部首和其他非字部件。
末級部件,再行拆解,及為漢字的最小構成單位:筆畫。書寫漢字時,筆畫的走向和出現的先後次序,即「筆順」,是比較固定的。基本規則是,從上到下,從左到右,先橫後豎,先撇後捺,先外後內,先外後內再封口,先中間後兩邊。不同書寫體漢字的筆順可能有所差異。
讀音
漢字是多種語言的共同書寫體系,每個字代表一個音節或數個音節(視語言而定)。此外念法上在日語以及各漢語方言中,讀音有「音讀」和「訓讀」之分。臺灣官方語言國語與中國大陸標準語普通話,與皆由一個聲母、一個韻母及聲調確定,實際用到1300多個音節。由於漢字數目龐大,因而有明顯的同音字現象;同時還有同一字多音的情形,稱為多音字或破音字。這一情況在各種漢語中是普遍存在的。
日語,在漢字的發音上,有著多音節,如國(こく)、肉(にく),也有單音節如空気(空氣)的気(き,Ki),此外有許多字因訓讀、音讀,在不同狀況,發不同音的情形。朝鮮語中漢字大致為一字一種發音,沒有訓讀。除了日本以外,其他漢字使用地區仍有少數字使用多音節字,如「浬」(海里)、「嗧」(加侖)、「瓩」(千瓦)、吋(英寸)、哩(英里)等。臺灣官方機構或民間均普遍使用,在大陸地區由於官方廢除已不使用,但一般人也理解其意思。
注音
最早的注音方法是讀若法和直注法。讀若法就是用音近的字來注音,許慎的說文解字就採用這種注音方法,如「埻,射臬也,讀若准」。 直注法就是用另一個漢字來表明這個漢字的讀音,如「女為說己者容」中,使用「說者曰悅」來進行注音。
以上兩種方法都有先天上不完善的地方,有些字沒有同音字或是同音字過於冷僻,這就難以發揮注音的作用,例如「襪音韈」等。魏晉時期發展出了反切法,據傳是受使用拼音文字的梵文影響。漢字的發音可以透過反切法進行標註,即用第一個字的聲母和第二個字的韻母和聲調合拼來注音,使得所有漢字發音都有可能組合出來。如「練,朗甸切」,即「練」的發音是「朗」的聲母與「甸」的韻母及聲調所拼成。
近代以來,又發展出了仿漢字形式的注音符號及眾多拉丁化拼音方式。注音符號一直都是台灣官方教學的一部分,學生在學習漢字前先要求必需掌握。而目前中國大陸最為廣泛使用的是漢語拼音。由於漢字以本身表義為主,注音方面較為薄弱。這個特性使得上下千年的文獻,不至於產生如同使用拼音文字的西方世界一樣,用字措辭太懸殊的差距,但也造成推斷古代聲韻的難度,必須進行專門的漢語音韻學才能推測它們在上古漢語和中古漢語的發音。例如「龐」從「龍」而得聲,但今日北京話前者讀「páng」(ㄆㄤˊ),後者為「lóng」(ㄌㄨㄥˊ)。此外有學者經研究認為:漢朝之前,一個漢字發音為兩個音節,即次要音節和主要音節。詳見上古漢語。
漢字與詞語
表意上,漢字是漢文組成的最小單位,大半漢字就可以為獨立表意單位,為單字
詞。隨著語言文字的發展,有大量慣用的雙字詞甚至多字詞出現,近代白話尤其眾多,主要分為同義複詞:如遭遇(二字同義);反義複詞:一笑泯恩仇(兩字反義,兩個意思都保存);偏義複詞:不吝惜「去留」(兩字反義,但只有「留」的意思)不過,從另一方面來說,準確掌握為數眾多的複合詞的搭配形式和用法也成了一種負擔。漢語常用詞彙約為幾萬條,總詞彙量約有百萬條,從數量上來說可能使有些人望而卻步。
而從古文的角度來看,多用字本義,比起過度依賴詞語,會來的精確且有效率,例如朱邦復先生就提倡精確使用「字」的復古作為。
漢字的數量
漢字由於是開放集合,數量並沒有準確數字,日常所使用的漢字約為幾千字。漢字數量的首次統計是漢朝許慎在《說文解字》中進行的,共收錄9353字。其後,南朝時顧野王所撰的《玉篇》據記載共收16917字,在此基礎上修訂的《大廣益會玉篇》則據說有22726字。此後收字較多的是宋朝官修的《類篇》,收字31319個;另一部宋朝官修的《集韻》中收字53525個,曾經是收字最多的一部書。
近代編集的字典收字量更高,如清朝的《康熙字典》收字47035個;臺灣的《中文大字典》收字49905個;大陸的《漢語大字典》收字54678;最新的《中華字海》收字85568個,包含了《漢語大字典》、《中文大字典》、《康熙字典》和《說文解字》的所有收字;日本的《大漢和字典》收字48902個,另有附錄1062個。21世紀已出版的字數最多的是《日本今昔文字鏡》,收字15萬個。
本世紀所新創的,還有第一批簡化字後跟第二批的「二簡字」,其中也包括社會上不少人造的文字,不過二簡字已被大陸官方廢除,只有少數字在社會上流行,但現時並沒有於計算機編碼中被收錄。在漢字計算機編碼標準中,目前最大的漢字編碼是臺灣的國家標準CNS11643,目前(4.0)共收錄可考證之正簡、日、韓語漢字共76,067個,在戶政系統等官方機構普遍使用。臺灣及港澳地區民間通用的大五碼收錄正體漢字13053個。GB 18030是中華人民共和國現時最新的內碼字集,GBK收錄簡體、繁體及日語、韓語漢字20912個,而早期的GB 2312收錄簡體漢字6763個。而Unicode的中日韓統一表意文字基本字集則收錄漢字20902個,另有兩個擴展區,總數亦高達七萬多字。
初期的漢字系統字數不足,很多事物以通假字表示,使文字的表述存在較大歧義。為完善表述的明確性,漢字經歷了逐步複雜、字數大量增加的階段。過去在漢字組成基本因子(前述字根部件)研究與教學上落後,造成學習上必須逐字學習難以舉一反三,漢字數量越多學習越困難,組建新字的風氣日趨保守,也沒有相應的資訊處理技術,於是有許多單一的漢語意義是以詞表示,例如常見的雙字詞,所以近代書寫的發展多朝向造新詞而非造新字。
常用字
中國大陸、香港、台灣地區
香港教育署於2000年頒佈的《常用字字形表》收錄4,759字,適用於香港;中華民國教育部於1996年頒佈的《常用國字標準字體》收錄4,808字,適用於台灣;國家語言文字工作委員會於1988年頒佈的《現代漢語常用字表》收錄3,500字(2,500個常用字,1,000個次常用字),適用於中國大陸。山西大學計算機科學系受國家語言文字工作委員會委託,抽樣統計200萬字的材料,檢測《現代漢語常用字表》收字的使用頻率。結果是:2,500常用字覆蓋率達97.97%,1,000次常用字覆蓋率達 1.51%,合計共3,500字覆蓋率達99.48%。 這說明只需學習約3,500個字,已可以正常閱讀中文。
日本
參見:當用漢字、常用漢字及日本漢字能力檢定 日本內閣於1946年頒佈《當用漢字》,收錄1,850漢字;文部省國語審議會(今文部科學省文化審議會)於1981年頒佈《常用漢字》,收錄1,945漢字,取代《當用漢字》。依《常用漢字》,1006個漢字在小學教授,939個在中學中教授,共計1,945個。自1975年,日本漢字能力檢定協會推出日本漢字能力檢定,測試日本人對漢字的掌握。直至2007年,共2,716,711人考核。成績分為12級,由最高至最低排列分別為:1級、準1級、2級、準2級、3級、4級、5級、6級、7、8級、9級、10級。
筆劃最少與最多的漢字
最簡單的漢字只有一劃,但卻不止一個字:除了「一」字以外,「丨」、「亅」、「丿」等都是漢字,而且都有各自的讀音。而現時已知最多筆畫的漢字,應該是「」,由3個「龍」字和3個「雲」個組合而成,共有84劃,這個字收錄於日本的TRON[1]計劃內。其次是由四個「龍」字組成的「」字,有64劃,收錄於統漢碼;同樣屬於64劃的字有四個興組成的字,收入自(中文大辭典)再之後的是由四個「雷」字組成的字,有52劃,收錄於《說文解字》。