當前位置:成語大全網 - 新華字典 - 中國漢字壹***有幾個?

中國漢字壹***有幾個?

漢字由於是開放集合,數量並沒有準確數字,日常所使用的漢字約為幾千字。漢字數量的首次統計是漢朝許慎在《說文解字》中進行的,***收錄9353字。其後,南朝時顧野王所撰的《玉篇》據記載***收16917字,在此基礎上修訂的《大廣益會玉篇》則據說有22726字。此後收字較多的是宋朝官修的《類篇》,收字31319個;另壹部宋朝官修的《集韻》中收字53525個,曾經是收字最多的壹部書。

近代編集的字典收字量更高,如清朝的《康熙字典》收字47035個;臺灣的《中文大字典》收字49905個;大陸的《漢語大字典》收字54678個;最新的《中華字海》收字85568個,包含了《漢語大字典》、《中文大字典》、《康熙字典》和《說文解字》的所有收字;日本的《大漢和字典》收字48902個,另有附錄1062個。21世紀已出版的字數最多的是日本《今昔文字鏡》,收字17萬個。

20世紀所新創的,還有第壹批簡化字後跟第二批的“二簡字”,其中也包括社會上不少人造的文字,不過二簡字已被大陸官方廢除,只有少數字在社會上流行,但現時並沒有於計算機編碼中被收錄。

在漢字計算機編碼標準中,目前最大的漢字編碼是臺灣的國家標準CNS11643,目前(4.0)***收錄可考證之正簡、日、韓語漢字***76,067個,在戶政系統等官方機構普遍使用。臺灣及港澳地區民間通用的大五碼收錄繁體漢字13053個。GB 18030是中華人民***和國現時最新的內碼字集,總***收錄70244個漢字;GBK收錄簡體、繁體及日語、韓語漢字20912個,而早期的GB 2312收錄簡體漢字6763個。而Unicode的中日韓統壹表意文字基本字集則收錄漢字20902個,另有四個擴展區,總數亦高達七萬多字。

初期的漢字系統字數不足,很多事物以通假字表示,使文字的表述存在較大歧義。為完善表述的明確性,漢字經歷了逐步復雜、字數大量增加的階段。過去在漢字組成基本因子(前述字根部件)研究與教學上落後,造成學習上必須逐字學習難以舉壹反三,漢字數量越多學習越困難,組建新字的風氣日趨保守,也沒有相應的信息處理技術,於是有許多單壹的漢語義義是以詞表示,例如常見的雙字詞,所以近代書寫的發展多朝向造新詞而非造新字。

漢字字位(或者叫“字素”、“字種”)是指將同壹個字的不同寫法(繁體字、簡體字、二簡字、正體字、異體字、新字形、舊字形、訛字、缺筆字等)計算為同壹個字,而不是分別計算為不同的字。例如:“夠”和“夠”被視為同壹個漢字的不同字位變體,而不是兩個漢字。這壹計算方法與英文類似,A與a寫法不同,但只是壹個字母,英語壹***26個字母,而不是52個。

根據統計,漢字字位數量大致在26500左右。後來編纂的字典所收的字越來越多,實際上增加的絕大多數是字位變體而不是字位。收字42174個的《康熙字典》僅僅比收字85568個的《中華字海》少1000個左右的字位。