中國的漢字總數沒有統壹的說法。有“漢字傑作”評價的《康熙字典》,在書的後面有壹個補遺,“附所有生僻字,有無義或根本無義的字”,收錄的漢字數量有四萬多個。1994.通過專家鑒定的北京國安咨詢設備有限公司漢字庫,有91251個有出處的漢字,據說是目前國內最全的漢字庫。與龐大的漢字庫形成鮮明對比的是,歷代日常書面語中常用的異體字數量壹般控制在三四千個。數量不超過原來的漢字甲骨文。國家在1988公布。
國家語委語言文字應用研究所原副所長紀恒泉認為,壹個國家的文字總量有增有減,但基本文字的數量是相對固定的。漢字有很多,可以分很多層次。中國有2500多個常用漢字。只要妳掌握了它們,妳就能熟練地閱讀現代漢語書面語。五卷本的《毛澤東文選》使用的漢字不超過2000個。小學語文教學大綱規定學生要認識3000個漢字。
紀恒泉說,漢字是歷史文化的載體,傳遞著壹定的信息,在不同的社會階段,其應用特點是不同的。隨著社會的發展,有些文字逐漸被淘汰。從現代漢語的角度來看,人們需要壹種更簡單的方式來表達自己的感情。“有四萬甚至九萬個漢字,恐怕很多人壹輩子都記不住。就算記住了,交流的時候不懂也沒用。”
隨著社會的發展,為了表達新事物,語言也在發展。九萬字的背後,是社會生活的不斷進步。由於中國的文字歷史悠久,這些文字構成了漢字庫的主體,主要體現在國家編纂的《說文解字》、《康熙字典》、《漢語大詞典》、《漢字海》等字集中。在語言本身的發展過程中,這是不可能的。就像孔乙己曾經堅持“茴香”二字有四種寫法壹樣,漢字中的異體字是漢字家族不斷壯大的重要原因。在20世紀50年代,國家列出了壹份異體字清單,但這項工作尚未完成。隨著漢語拼音的提出,這項工作沒有進行到底。中國社會科學院研究生院語言系教授巢紀舟先生對此進行了解釋。
據參與《新華字典》和《現代漢語詞典》編纂的中國社會科學院語言研究所研究員劉慶龍先生介紹,收集整理如此大的字體,不僅是為了日後參考,也是為了印刷漢字、整理古籍、出國留學,更是為制作人名表和證書、在中國地圖上標註地名提供了高水平的字體工具。90年代初,國家做了壹個包含2090的字體工具。
整理漢字庫的原因:壹是為了滿足國際要求建立國際文字的需要,做壹個國際通用字庫,方便國際文字的交流。目前,國際ISO國家標準委員會正在征集各國字符;二是要適應電腦輸入法的發展,擴大電腦字體。目前,信息產業部計算機標準化研究所也正在對該漢字字形進行統計整理,已整理出近7萬字。第三,漢字發展過程中的字體變形,使得有些字看起來和漢字不壹樣,需要整理統壹。