中國的漢字總數沒有共識。有“漢字傑作”評價的《康熙字典》在書的後面有壹個補遺,“附所有生僻字,有完全無音無義的字”,收錄了四萬多個漢字。1994出版的《漢字海》收錄了87019個漢字,而已經通過專家鑒定的北京國安咨詢設備公司的《漢字字體》收錄了91251個帶出處的漢字,據說是目前國內最全的字體。與龐大的漢字庫形成鮮明對比的是,歷代日常書面語中常用的異體字數量壹般控制在三四千個。甲骨文的數量沒有超過原始文字。國家1988公布的《現代漢語常用詞表》共收錄了2500個常用詞和1000個次常用詞,總共只有3500個詞。
國家語委語言文字應用研究所原副所長紀恒泉認為,壹個國家的文字總量有增有減,但基本文字的數量是相對固定的。漢字有很多,可以分很多層次。中國有2500多個常用漢字。只要妳掌握了它們,妳就能熟練地閱讀現代漢語書面語。在五卷本的《毛澤東文選》中,不超過2000個不同的漢字。小學語文教學大綱規定學生要認識3000個漢字。如果他們掌握了超過65,438+0,800個漢字,他們就可以識字。
紀恒全說,文字是歷史文化的載體,傳遞著壹定的信息,在不同的社會階段,文字的應用特點是不同的。隨著社會的發展,壹些文字逐漸被淘汰。從現代漢語的角度來看,人們需要壹種更簡單的方式來表達自己的感情。“漢字有四萬多個,甚至九萬個,恐怕很多人壹輩子都記不住。漢字裏有很多生僻字,就算妳記住了,交流的時候對方不懂也沒用。”就這樣,很多生僻字逐漸從常用字中被淘汰。
隨著社會的發展,為了表達新事物,語言也在發展。九萬字的背後,是社會生活的不斷進步。由於中國文字歷史悠久,這些字構成了漢字庫的主體,主要體現在國家編纂的《說文解字》、《康熙字典》、《漢語大詞典》、《漢語詞海》等字集中。在語言本身的發展過程中,不可避免地會出現大量的異體字和不規範字。就像孔乙己曾經堅持“茴香”二字有四種寫法壹樣,漢字中的異體字是漢字家族不斷壯大的重要原因。20世紀50年代,我國列出了異體字清單,但這項工作沒有完成。隨著漢語拼音的提出,這項工作沒有進行到底。中國社會科學院研究生院語言系教授巢紀舟先生對此進行了解釋。
據參與《新華字典》和《現代漢語詞典》編纂的中國社會科學院語言研究所研究員劉慶龍先生介紹,收集整理如此大的字體,不僅是為了日後參考,也是為了印刷漢字、整理古籍、出國留學,更是為制作人名表和證書、在中國地圖上標註地名提供了高水平的字體工具。90年代初,國家制作了包含20902個字的國家標準字表,但在使用過程中發現字表遠遠不夠,補充工作仍在進行中。
整理漢字庫的原因:壹是為了滿足建立國際文字的國際要求,做壹個國際通用字庫,方便國際文字的交流。目前,國際ISO國家標準委員會正在收集各國的字符;二是適應計算機輸入法的發展,擴展計算機字體。目前,信息產業部計算機標準化研究所也在進行漢字字庫的統計整理工作,已整理出近7萬字;第三,漢字發展過程中的字體變形,使得有些字看起來和漢字不壹樣,需要整理統壹。