詳細回答:
漢字總數已經超過8萬
2001年9月,新華社發布最新統計信息。目前漢字總數已經超過8萬個,而常用字只有3500個。雖然常用詞數量變化不大,但詞庫總數有所增加。近年來,漢語詞典收錄的漢字總數從5萬多個增加到8萬多個。但歷代日常書面語中常用的異體字數量壹般控制在3000到4000個,並沒有超過最初的甲骨文。選取當代常用字作為學習和使用漢字的重點,是歷代漢字整理和教學的重要內容。歷史上的三字經、千字文都是用當時常用的文字編寫的識字課本。
現代漢語用字也符合這個規律。據統計,葉聖陶的小說《倪煥之》有138330個字,使用的異體字只有3039個。老舍小說《駱駝祥子》有107360個字,只用了2413個不同的漢字。《毛澤東文選》(第1 ~ 4卷)包含659928個字,僅用了2981個異體字。可見,常用詞是客觀存在的。它們是學習和使用漢字時應該註意的重點。)
有“漢字傑作”評價的《康熙字典》在書的後面有壹個補遺,“收錄所有生僻字,然後附上工具書,包括完全沒有聲音或意義的字”,收錄了四萬多個漢字。1994出版的《漢字海》收錄了87019個漢字,而已經通過專家鑒定的北京國安咨詢設備公司的《漢字字體》收錄了91251個帶出處的漢字,據說是目前國內最全的字體。與龐大的漢字庫形成鮮明對比的是,歷代日常書面語中常用的異體字數量壹般控制在三四千個。甲骨文的數量沒有超過原始文字。國家1988公布的《現代漢語常用詞表》共收錄了2500個常用詞和1000個次常用詞,總共只有3500個詞。
生僻字逐漸被淘汰
國家語委語言文字應用研究所原副所長紀恒泉認為,壹個國家的文字總量有增有減,但基本文字的數量是相對固定的。漢字有很多,可以分很多層次。我國有2500多個常用漢字。只要我們掌握了它們,我們就能熟練地閱讀現代漢語書面語。《毛澤東文選》五卷本中使用的漢字只有2000多個。《小學語文教學大綱》規定,學生要認識3000個漢字,掌握1800個以上的漢字,就可以“識字”。電腦字庫中的漢字總數剛剛超過2萬。王永民在學習“吳彼字體輸入法”時,將《現代漢語詞典》中的1.2萬多個漢字逐壹分解合並成上百個偏旁部首,再與電腦相關鍵連接,基本滿足了日常需要。
紀恒全說,文字是歷史文化的載體,傳遞著壹定的信息,不同社會階段使用文字的特點也不同。隨著社會的發展,壹些文字逐漸被淘汰。從現代漢語的角度來看,人們需要壹種更簡單的方式來表達自己的感情。“漢字有四萬多個,甚至九萬個,恐怕很多人壹輩子都記不住。漢字裏有很多生僻字,就算妳自己記住了,交流的時候對方不懂也沒用。”就這樣,很多生僻字逐漸從常用字中被淘汰。推廣使用規範漢字,可以減少不必要的交流障礙,大大減輕學習讀寫、印刷排版、計算機漢字記憶的負擔。
九萬個漢字從何而來
漢字有五千年的歷史。早在新石器時代晚期的彩陶上,就出現了圖畫和符號,這就是漢字的前身。現在能看到的最早的成熟漢字是商代刻在動物骨頭和龜甲上的甲骨文。當時用了4600多字。
隨著社會的發展,為了表達新事物,語言也在發展。九萬字的背後,是社會生活的不斷進步。由於漢字歷史悠久,這些字構成了漢字庫的主體,主要體現在國家編纂的字集上,包括《說文解字》、《康熙字典》、《漢語大詞典》、《漢語詞海》。在語言本身的發展過程中,不可避免地會出現大量的異體字和不規範字。就像孔乙己曾經堅持“茴香”二字有四種寫法壹樣,漢字中的異體字是漢字家族不斷壯大的重要原因。在20世紀50年代,我們國家列出了壹份異體字清單,但這項工作尚未結束。隨著漢語拼音的提出,這項工作並沒有進行到底。中國社會科學院研究生院語言系教授巢紀舟先生對此進行了解釋。
隨著與外界接觸的擴大,壹些外來詞開始進入我們的語言系統,如沙發、經濟、迷妳裙等。漢字系統中也有外來詞,但數量很少。人們常說“2008”,卻很少說“2008”。“?”明顯不同於構詞成分為左右的漢字,它來源於阿拉伯字母。另外,有些國家,比如韓國、日本,過去用漢字,後來用漢字的偏旁部首造了壹些新詞。前者還是漢字家族,也會收在漢字庫裏。這些字符屬於國際標準字符集漢字,也是壹個龐大的漢字庫的壹部分。目前,字體整理中壹般會收錄新加坡、越南、馬來西亞等周邊國家的漢字。
同時,字庫還將收集古今姓氏和上述字集、字典、字書不能收錄的名字。劉先生認為,由於我國人口多、面積大,很多地方文字、方言字、人名也是漢字字庫的組成部分,早已編入字典,包括臺灣省、香港等地,已整理出約40余本地方文字字典。比如澳門有個當島。現在很多人洗頭後都喜歡用水來固定發型。“啫喱水”是壹個香港術語,也逐漸被大家接受。
數漢字是做什麽的?
據參與編纂《新華字典》和《現代漢語詞典》的中國社會科學院語言研究所研究員劉慶龍先生介紹,收集整理如此大的字體,不僅是為了日後參考,也是為了印刷漢字、整理古籍、編纂辭書、整理和研究國內外漢字,更是為我國地圖上制作人名、證件清單和標註地名提供了壹個高水平的字體工具。90年代初,國家制作了包含20902個字的國家標準字表,但在使用過程中發現字表遠遠不夠,目前正在進行補充工作。
整理漢字庫的原因:壹是為了滿足國際要求建立國際文字的需要,做壹個國際通用字庫,方便國際文字的交流。目前,國際ISO國家標準委員會正在征集各國字符;二是適應計算機輸入法的發展,擴展計算機字體。目前,信息產業部計算機標準化研究所也在進行漢字字庫的統計整理工作,已整理出近7萬字;第三,漢字發展過程中的字體變形,使得有些字看起來和漢字不壹樣,需要整理統壹。
世界上有多少個漢字?這個問題恐怕目前誰都很難解釋。
最早的書法書籍是東漢許慎編纂的《說文解字》,有9353個漢字。《說文解字》的出現使漢字的書寫有了統壹的標準和規範,許慎因此被歷代學者尊為“漢字聖人”。
南北朝時期,南梁顧編纂的《片玉》收字16917。這本書經過唐宋修訂,收字增至22726字。宋代丁度等人編纂的《廣韻》收字53525字,是我國古代用字最多的字典。清代張玉書編纂的《康熙字典》收字47035字。辛亥革命後,歐陽普存主編的《漢語大詞典》收字48000余字。
近幾年出版的《漢語大詞典》收錄了56000多個漢字,是迄今為止漢字數量最多的詞典。新編纂的《漢字之海》告訴人們,漢字有近9萬個。該書因收入前綴8.6萬,被大眾媒體稱為新世界之最。