漢字是意音文字,不是拼音文字。是用表意體系的符號來表示漢語的詞或語素的。
壹個漢字通常表示漢語裏的壹個詞或壹個語素,這就形成了音、形、義統壹的特點。漢字是由筆畫構成的方塊狀字,所以又叫方塊字。如“車”“上”“明”等,“車”“上”“明”用字的形體來直接表達語言裏的詞義;“問”既能表意又能表音,“門”表音,“口”表意。
漢字經過了幾千年的演變,逐漸形成了“漢字七體”,即:甲骨文、金文、篆書、隸書、草書、楷書、行書。
日文:漢字(日本漢字);かんじ(平假名)
朝鮮文/韓文:?(諺文);漢字(朝鮮漢字)
越南文:ch? Hán;?漢(喃字)
英文:Chinese characters
阿拉伯文:?
西班牙文:los caracteres de chino
法文:les caractères de chinois
德文:Chinesische schriftzeichen
俄文:Китайский иероглиф
葡萄牙文:Chinesische schriftzeichen
意大利文:I caratteri cinesi 商周時期,通用的文字是甲骨文。這是壹種成熟而系統的文字,為後世的漢字發展奠定了基礎。之後流行的青銅銘文(金文)雖有字數的增加,但形體並無大的變化。
春秋以後,由於諸侯割據,“文字異形”。秦統壹後,為鞏固統治,始皇帝令丞相李斯、中車府令趙高、太史令胡毋敬等整理文字,以原秦國字為基礎制定出小篆,作為標準字體,通令全國使用。稍後,程遍又依當時民間流行的字體,整理出更簡便的字體隸書,並作為日用文字在全國廣為流傳。
曹魏時,鐘繇創立真書(楷書)。至此漢字的演化已臻完善。不僅如此,自東漢末年,漢字的書寫已成壹種專門的藝術即書法。
中國史學界較普遍的壹種說法是:中國文字源始於殷商。實際上,殷商時代的甲骨文已很成熟,在此之前,應該有壹個從發生、發展到漸趨成熟的過程,因此有人主張推至夏末;也有人主張推至夏以前,各執己見。郭沫若在《古代文字之辯證的發展》指出:“漢字究竟源始於何時呢?我認為,這可以從西安半坡村遺址距今的年代為指標。”,“半坡遺址年代距今有六千年左右。”,“半坡遺址是新石器時代仰韶文化的典型”,“半坡彩陶上每每有壹些類似文字的簡單刻劃,和器上的花紋判然不同。”“雖然刻劃的意義至今尚未闡明,但無疑是具有文字性質的符號。”“可以肯定地說就是中國文字的起源,或者中國原始文字的孑(jié)遺。”如按此說,中國文明則應算成近六千年。中國文字之源始,究竟在何時?最古老的文字產生於什麽時代?分別代表什麽含義?至今還尚在百家爭鳴中,看來還有待於大量的材料來佐證說明。 漢字的數量並沒有準確數字,大約將近十萬個(北京國安咨訊設備公司漢字字庫收入有出處漢字91251個),日常所使用的漢字只有幾千字。據統計,1000個常用字能覆蓋約92%的書面資料,2000字可覆蓋98%以上,3000字時已到99%,簡體與繁體的統計結果相差不大。
關於漢字的數量,根據古代的字書和詞書的記載,可以看出其發展情況。
秦代的《倉頡》、《博學》、《爰歷》三篇***有3300字;漢代揚雄作《訓纂篇》有5340字,到許慎作《說文解字》 就有9353字了;據唐代封演《聞見記·文字篇》所記,晉呂忱作《字林》有12824字,後魏楊承慶作《字統》有13734字,南朝時顧野王所撰的《玉篇》據記載***收16917字,在此基礎上修訂的《大廣益會玉篇》則據說有22726字;唐代孫強增字本《玉篇》有22561字。宋代司馬光修《類篇》多至31319字,宋朝官修的《集韻》中收字53525個,曾經是收字最多的壹部書;清代《康熙字典》有47000多字了;915年歐陽博存等編著的《中華大字典》有48000多字;1959年日本諸橋轍次主編的《大漢和辭典》有49964字;1971年張其昀主編的《中文大辭典》有49888字;1990年徐仲舒主編的《漢語大字典》有54678字;1994年冷玉龍等編著的《中華字海》有85000字。臺灣地區教育主管機關編撰的《異體字字典》第五版,內容含正字與異體字,***106230字,是收錄最多漢字的字典。
歷史上出現過的漢字總數有8萬多(也有6萬多的說法),其中多數為異體字和罕用字。絕大多數異體字和罕用字已被規範掉,除古文之外壹般只在人名、地名中偶爾出現。此外,繼第壹批簡化字後,還有壹批“二簡字”,已被廢除,但仍有少數字在社會上流行。
如果學習和使用漢字真的需要掌握七八萬個漢字的音形義的話,那漢字將是世界上沒人能夠也沒人願意學習和使用的文字了。但是《中華字海》壹類字書裏收錄的漢字絕大部分是“死字”,也就是歷史上存在過而今天的書面語裏已經廢置不用的字。據統計,十三經(《易經》、《尚書》、《公羊傳》、《論語》、《孟子》等13部典籍)全部字數為589283個字,其中不相同的單字字數為6544個字。因此,實際上人們在日常使用的漢字不過六千多而已。
在漢字計算機編碼標準中,最大的漢字編碼是臺灣地區的CNS11643,5.0版全字庫可供查詢的字***87,047個漢字、10771個拼音文字及894個符號。臺港民間通用的大五碼收錄繁體漢字13053個。GB18030是中華人民***和國現時最新的內碼字集,GBK收錄漢字簡體、繁體及20912個,而早期的GB2312收錄簡體漢字6763個。Unicode的中日朝(韓)統壹表意文字基本字集則收錄漢字20902個,總數亦高達七萬多字。
初期的漢字系統字數不足,很多事物以通假字表示,使文字的表述存在較大歧義。為完善表述的明確性,漢字經歷了逐步復雜、字數大量增加的階段。漢字數量的過度增加又引發了漢字學習的困難,單壹漢字能表示的意義有限,於是有許多單壹的漢語意義是用漢語詞語表示,例如常見的雙字詞。漢語書寫的發展多朝向造新詞而非造新字。殷墟的甲骨文更早、與漢字起源有關的出土資料。這些資料主要是指原始社會晚期及有史社會早期出現在陶器上面的刻畫或彩繪符號,另外還包括少量的刻寫在甲骨、玉器、石器等上面的符號。可以說,它們***同為解釋漢字的起源提供了新的依據。 漢字是“形、音、義”的結合體,大多數漢字是由形旁和聲旁組成的。
六書是漢字構字的基本原理。在《周禮》中就提到了六書,只是沒有說明具體內容。到了東漢,許慎在《說文解字》 中,詳細闡述了“六書”構造原理:象形、指事、會意、形聲、轉註、假借。
象形:這種造字法是依照物體的外貌特征來描繪出來,所謂“畫成其物,隨體詰詘”是也。如日、月、山、水等四個字,最早就是描繪日、月、山、水之圖案,後來逐漸演化變成如今的造型。
瓜是壹個象形字。“瓜”字中,兩撇表示藤,中間豎鉤表示瓜,捺表示葉。“葫蘆科植物的統稱”就是“瓜”的本義。“形狀像瓜”,在現實生活中有很多東西像瓜形的,比如,“瓜皮帽”是帽子的壹種;“瓜皮船”是船的壹種。“像切瓜壹樣”,瓜的命運是要被切分的,由此引申出此義。人們用“瓜分”表示分割或分配。又指若幹強國聯合起來分割弱小或不發達國家的土地。“傻瓜”,表示不聰明,這壹詞來自古代的“瓜子族”,春秋時期生活在瓜州(甘肅敦煌壹帶)姜姓人被稱為“瓜子族”,他們十分勤勞,受人雇傭時總是壹刻不停地幹活,可是有些人把他們這種老實的習俗看作“傻”,於是就有了“傻瓜”了。
指事:這是指表現抽象事情的方法,用象征的符號,或在象形字上加上符號來表示某個詞。所謂“各指其事以為之”是也。如人在其上寫作“上”,人在其下寫作“下”,“刃”,在刀口上加壹點,表示這裏最鋒利,這就是刀刃,等等。自大壹點就是“臭”,“富”有田的人,“窮”靠用“力”打工,“賤”的繁體是“賤”,右邊兩個“戈”,為錢而爭鬥,自然是“賤”。
形聲:就是文字內以特定形狀(字根)表特有的音。例如胡。這個字也可為壹個字根,結合不同的屬性字根,可合成為:蝴、蝴、湖、葫、瑚、醐等等,而以同樣的發音(也有的只有聲母壹樣),表達不同的事物。形聲是漢字裏造字最多的方法和神韻。
形聲字的形旁和聲旁有四種組合方式:
左形右聲:情、憶、哼、獷、構、描……
右形左聲:期、戰、鸚、鳩、領、飄……
上形下聲:宇、笆、霧、草、景、符……
下形上聲:盂、貨、娶、基、裘、盒……
內形外聲:聞、問、悶、瓣、辮、辯……
外形內聲:園、囤、病、衷、閣、匣……
形占壹角:疆、騰、栽、裁、載……
有些形聲字,隨著漢字的改革表音部分的讀音有了變化,已經不起表音的作用了,如果再讀半邊就要鬧笑話。“秀才識字讀半邊”又成了對“秀才”們讀錯字的諷刺。
會意:這種造字法,是用兩個或幾個字組成壹個字,把這幾個字的意義合成壹個意義。如“日”和“月”組起來,就是日光加月光變成“明”。“人”字和“言”字合成“信”字,意思就是人過去所言有信,就是這個人很遵守自己說過的話,“休”,“人”和“木”合在壹起,壹個人靠在樹上,表示休息。
有些會意字是兩個或幾個同樣的字重疊組成的。二字重疊的多是左右的並列結構,三字重疊的多是塔型的上下結構,看起來像體操活動中的疊羅漢。例如三個“人”組成“眾”;三個“火”組成“焱”;三個“木”組成“森”;三個“日”組成“晶”;三個“直”組成“矗”;三個“水”組成“渺”;三個“口”組成“品”等。
會意字由於字形的變化太大,已看不出它們的字源了。例如婦女的婦字,為什麽在女旁加個歪山呢?正確的字源分析只能從繁體字“婦”中才能看出。這個“婦”字左邊的“女”旁指婦女,女旁的“帚”是掃帚,前後合在壹起的意思是婦女拿著掃帚在家裏勞動。“女、帚為婦”和“力、田為男”是符合當時的“女內男外”、“男耕女織”的社會情況的。這類不容易看出字源的字相當多,人們叫作“破體字”。
“她”是現代漢語裏常用的壹個人稱代詞,專指第三者的女性。此字是古代“姐”字的異體,20世紀20年代由劉半農首先作為第三人稱女性代詞使用,並非新造字。
轉註:這是用於兩個字互為註釋,彼此同義而不同形,漢代許慎解釋道:“建類壹首,同意相受,考、老是也。”這怎麽說呢?此二字,古時“考”可作“長壽”講,“老”、“考”相通,意義壹致,即所謂老者考也,考者老也。《詩經·大雅·棫樸》亦雲:“周王壽考”。
假借:此法簡言之,就是借用壹字,去表達別的事物。壹般來說,有壹個無法描述的新事物,就借用壹個發音接近或是屬性近似的字根,來表達這個新事物。例如“又”,本來是指右手(最早見於甲骨文),但後來被假借當作“也是”的意思。又如“聞”,本意是用耳朵聽的意思,《大學》中就有“視而不見,聽而不聞,食而不知其味”,後來被假借成嗅覺動詞。
總結以上六書——前兩項,“造字法”也;中兩項,“組字法”也;後兩項,“用字法”也。總而言之,以上原理是古代文字學學者們群策群力歸納出來的文字學理論,其所含的漢字構成法則,並非壹人獨創,是人們在使用過程中長期演化而成,是壹代又壹代集體智慧的結晶。 漢字由表意象形字根,如金、木、水、火、土等,像積木壹樣組合而成。因形狀方正,有“方塊字”的別稱,從結構上來看,漢字有以下特色:
規整的字體(如楷書、宋體、隸書、篆書等)書寫下的漢字是壹種方塊字,每個字占據同樣的空間。漢字包括獨體字和合體字,獨體字不能分割,如“文”、“中”等;合體字由基礎部件組合構成,占了漢字的90%以上。合體字的常見組合方式有:上下結構,如“笑”、“尖”;左右結構,如“詞”、“科”;半包圍結構,如“同”、“趨”;全包圍結構,如“團”、“回”;上中下結構,如“贏”;左中右結構,如“斑”;“品”字形結構,如“品”。漢字的基礎部件包括獨體字、偏旁部首和其他不成字部件。
漢字的最小構成單位是筆畫,筆畫也具有壹定的含義,如橫畫(壹),可表示地平線(如旦字中的壹橫)等。
書寫漢字時,筆畫的走向和出現的先後次序,即“筆順”,是比較固定的。基本規則是,先橫後豎,先撇後捺,從上到下,從左到右,先外後內,先外後內再封口,先中間後兩邊。不同書寫體漢字的筆順可能有所差異。
從字體上分,可將各類漢字的字體分為三大類型。第壹類是從宋代活字印刷發展起來的宋體、黑體(包括粗、細等線體)等;第二類是由書法演變而來的字體,如楷體、仿宋體、行楷、隸體、魏體、舒體、顏體、瘦金體以及鋼筆書寫的字體等;第三類是屬於美術字體,如綜藝、美黑、琥珀、水柱等。其他字體多是屬於以上三類字體的變異,例如:由宋體演變的大標宋、小標宋、報宋、長宋、中宋、姚體等;由黑體演變而成的大黑、平黑、粗黑、等線體(包括粗、中、細等線體,後又演變出粗、準、細圓體)等;由楷體、仿宋體等演變而來的中楷和細仿宋等;由黑體和宋體演變而來的美黑;由隸體演變而來的隸變體等。
筆畫最少的漢字只有壹劃。有的字在書面上沒有,只在民間流傳“biang”是筆畫較多的漢字,有56筆,異體字***有45筆,繁體字***有59筆。“biangbiang面”是源於陜西的壹種面,也是壹家面館的品牌,還在使用這個字,流傳不廣,近幾年方才流行,聲稱只能在康熙字典中查到“biang”字寫法。事實上,在康熙字典中查不到“biang”字的寫法。
關於biang,有壹個字謎:
壹點飛上天,黃河兩道彎,八字大張口,言字往裏走 。
東壹扭,西壹扭。左壹長,右壹長,中間坐了個馬大王。
心字底,月字旁,打個勾勾掛麻糖,
推個車車逛鹹陽。
日文漢字有壹個字有84畫之多,日語讀作“たいと”(Tai-To)。 漢字是漢語的書寫文字,每個字代表壹個音節。中國大陸現今以普通話作為標準讀音,普通話的音節由壹個聲母、壹個韻母及聲調確定,實際用到1300多個音節。由於漢字數目龐大,因而有明顯的同音字現象;同時還有同壹字多音的情形,稱為多音字。這壹情況在漢語各種方言中是普遍存在的。
漢字雖然以表意為主,但並非沒有表音成分,最常見的是人名、地名,其次就是外來詞的音譯,比如沙發。此外,還有部分原有的表音詞,如壹命“嗚呼”、“哈哈”大笑等。但即使如此,還是有壹定表意成分,特別是該國國內的人名、地名。而即使是國外的人名、地名,也存在某些表意的底線,比如“Bush”絕不能音譯成“不死”。
有學者經研究認為:漢朝之前,壹個漢字發音為兩個音節,次要音節和主要音節。由於漢字本身不表音,自漢朝到20世紀漢字在數量上、寫法上雖有變遷,但無法看出發音的變化。必須進行專門的研究才能推測它們在上古漢語和中古漢語的發音。漢字在日語中的讀音有“音讀”和“訓讀”之分,往往壹個字有很多讀法,原因來自中國不同時期傳入日本的發音。
除了日本以外,其他漢字使用地區也有使用了壹些多音節的字,如“浬”(海裏)、“嗧”(加侖)、“瓩”(千瓦)等。但是在大陸地區由於官方廢除已基本不使用,臺灣仍在使用,壹般人也明了其意思。
最早的註音方法是讀若法和直註法。讀若法就是用音近的字來註音,許慎的《說文解字》 就采用這種註音方法,如“埻,射臬也,讀若準”。直註法就是用另壹個漢字來表明這個漢字的讀音,如“女為說己者容”中,使用“說者曰悅”來進行註音。
以上兩種方法都有先天上不完善的地方,有些字沒有同音字或是同音字過於冷僻,這就難以起到註音的作用,例如“襪音韈”等。
魏晉時期發展出了反切法,據傳是受使用拼音文字的梵文影響。漢字的發音可以通過反切法進行標註,即用第壹個字的聲母和第二個字的韻母和聲調合拼來註音,使得所有漢字發音都有可能組合出來。如“練,朗甸切”,即“練”的發音是“朗”的聲母與“甸”的韻母及聲調所拼成。
近代以來,又發展出了漢字形式的註音符號以及很多拉丁字母註音方法。註音符號仍是臺灣地區教學的壹部分,而目前中國大陸最為廣泛使用的是漢語拼音。
由於漢字以本身表義為主,註音方面較為薄弱。這個特性使得上下千年的文獻,不至於產生如同使用拼音文字的西方壹樣,用字措辭太懸殊的差距,但也造成推斷古代聲韻的難度。例如“龐”從“龍”而得聲,但今日北京話前者讀“páng”,後者為“lóng”。如何解釋這樣的差異,就是音韻學所探討的課題。需要註意的還有聲調:陰平,陽平,上聲,去聲,輕聲(元音āáǎàa ōóǒòo ēéěèe īíǐìi ūúǔùu ǖǘǚǜü) 語素是漢文表意的最小單位,類比於英語的“詞匯”和“詞組”的總稱。絕大多數漢字可以獨立構成語素,比如“我”,類比於英語中的單壹字母構成的詞匯,比如“I”。現在白話文大多數詞語都是由兩個以上的漢字構成的,不過,和英語中“詞匯”和“字母”的關系不同,語素的意思往往和其中各個漢字獨立構成語素時的意思有相關性,因此相當程度上簡化了記憶。詞語包括語素和若幹個語素形成的短語。
漢字的高效率,體現在幾百個基本象形字,可以合成表示天上地下的各種事物的上萬漢字;幾千個常用字,又可以輕松組合出數十萬詞語。 中國古代稱“字書”,直到《康熙字典》問世才稱“字典”。最早的漢語字 典是東漢許慎編的《說文解字》 。近代大致可分為兩類,壹類是綜合性的,如《新華字典》;壹類是專門性的,如《異體字字典》。1915年,中華書局出版了《中華大字典》。
世界三大漢語詞典分別是中國大陸的《漢語大詞典》(***13冊,5.6萬詞條,37萬單詞)、中國臺灣的《中文大辭典》(***10冊,5萬詞條,40萬單詞)以及日本的《大漢和辭典》(***13冊,4.9萬詞條,40萬單詞)。漢字是記錄漢語的文字,它已有六千年左右的歷史,是世界上最古老的文字之壹。
“最中國”漢字“和”:2008年北京奧運會開幕式上,幾百名演員扮演的活字印刷字模通過不斷變幻,用大篆、小篆、楷書三種不同字體展現了同壹個漢字――“和”。這壹幕至今讓人津津樂道,而這個包含“和諧”“和平”“和睦”等意義的漢字,再度被評選為“最中國”的漢字。最新壹期的《中華遺產》雜誌發布了該社組織的“100個最具中華文化意義的漢字”評選結果。“和”字贏得了網上投票的最高票數,也獲得了臺灣“中央研究院”歷史語言研究所研究員李貞德等專家的大力推薦。