2001年9月,新華社發布最新統計信息。目前,漢字總數已超過8萬個,而常用字只有3500個。雖然常用詞的數量沒有太大變化,但詞庫的總數卻增加了。近年來,漢語詞典收錄的漢字總數從5萬多個增加到8萬多個。但歷代日常書面語中常用的異體字數量壹般控制在3000至4000個,並未超過原始甲骨文。選取當代常用字作為學習和使用漢字的重點,是歷代漢字整理和教學的重要內容。歷史上的《三字經》和《千字文》都是用當時常用的文字編寫的識字課本。
現代漢語的用字也符合這壹規律。據統計,葉聖陶的小說《倪煥之》有138330個字,使用的不同漢字只有3039個。老舍的小說《駱駝祥子》有107360個字,只用了2413個不同的漢字。《毛澤東選集》(1 ~ 4卷)包含659928個單詞,僅使用了2981個不同的漢字。可見,常用詞是客觀存在的。它們是學習和使用漢字時應該註意的要點。)
有著“漢字傑作”評價的《康熙字典》,在書的後面有壹個補遺,“凡生僻字皆收,然後附工具書,包括完全沒有聲音或意義的字”,共收了4萬多個漢字。1994出版的漢字Sea收錄了87019個漢字,而通過專家鑒定的北京國安咨詢設備公司的漢字字體有91251個漢字,並附有出處,據說是目前中國最完整的字體。與龐大的漢字庫形成鮮明對比的是,歷代日常書面語中常用的不同漢字數量普遍控制在三四千個。數量沒有超過甲骨文的原文。國家在1988年公布的《現代漢語常用字表》共收錄了2500個常用字和1000個次常用字,總共只有3500個字。
生僻字逐漸被淘汰
國家語委語言文字應用研究所原副所長紀恒泉認為,壹個國家的文字總量有增有減,但基本文字的數量相對固定。漢字有很多,可以分為很多層次。我國有2500多個常用漢字。只要我們掌握了它們,我們就能熟練地閱讀現代漢語書面語。在五卷本的《毛澤東文選》中,只有2000多個不同的漢字。《小學語文教學大綱》規定,學生要認識3000個漢字,如果掌握了1800個漢字以上,就可以“識字”。電腦字體中的漢字總數剛剛超過2萬個。王永民在研究“吳彼字庫輸入法”時,將《現代漢語詞典》中的65438+20萬多個漢字逐壹分解並合並成數百個偏旁部首,再與電腦相關按鍵連接,基本滿足了日常所需。
紀恒全表示,文字是歷史文化的載體,傳遞著壹定的信息,不同社會階段使用文字的特點也有所不同。隨著社會的發展,壹些漢字已經逐漸被淘汰。從現代中國人的角度來看,人們需要壹種更簡單的方式來表達他們的感情。“漢字有四萬多個甚至九萬個,恐怕很多人壹輩子都記不住。漢字中有很多生僻字,即使妳自己記住了,如果交流時對方聽不懂也沒用。”就這樣,許多生僻字逐漸從常用字中被淘汰。推廣使用規範漢字可以減少不必要的交流障礙,大大減輕學習讀寫、印刷排版和計算機漢字記憶的負擔。
九萬個漢字從何而來
漢字有五千年的歷史。早在新石器時代晚期的彩陶上就出現了圖畫和符號,這就是漢字的前身。現在能看到的最早的成熟漢字是商代刻在動物骨頭和龜甲上的甲骨文。當時使用了4600多個單詞。
隨著社會的發展,為了表達新事物,語言也在發展。9萬個漢字的背後,是社會生活的不斷進步。由於漢字歷史悠久,這些漢字構成了漢字庫的主體,主要體現在國家編纂的《說文解字》、《康熙字典》、《漢語大詞典》、《漢語詞海》等字集中。在語言本身的發展過程中,不可避免地出現了大量的異體字和不規範字。正如孔乙己曾堅持“茴香”壹詞有四種寫法壹樣,漢字中的異體字是漢字家族不斷壯大的重要原因。20世紀50年代,我國列出了異體字清單,但這項工作尚未結束。隨著漢語拼音的提出,這項工作沒有進行到底。中國社會科學院研究生院語言學系教授晁繼洲先生對此進行了解釋。
隨著與外界接觸的擴大,壹些外來詞開始進入我們的語言系統,如沙發、經濟、迷妳裙等。漢字系統中也有外來詞,但數量很少。人們經常說“2008”,但很少說“2008”。“?”明顯不同於構詞成分為左右的漢字,它來自阿拉伯字母。此外,壹些國家,如韓國和日本,過去使用漢字,後來用漢字的偏旁部首造了壹些新詞。前者還是漢字族,也會收在漢字庫中。這些字符屬於國際標準字符集漢字,它們也是壹個龐大的漢字字庫的壹部分。目前,來自新加坡、越南、馬來西亞等周邊國家的漢字普遍被納入字體整理。
同時,字庫還將收集古今姓氏和上述字集、字典和字書無法收錄的名字。劉先生認為,由於中國人口多、面積大,許多方塊字、方言字和人名也是漢字字庫不可分割的壹部分,漢字字庫很早就被編入字典,包括臺灣省和香港地區,目前已整理出約40余本方塊字字典。比如澳門有個當島。如今,許多人喜歡在洗完頭發後用水固定發型。“啫喱水”是壹個香港術語,它已經逐漸被大家所接受。
妳通過計算漢字來做什麽?
據參與編纂《新華字典》和《現代漢語詞典》的中國社會科學院語言研究所研究員劉慶龍先生介紹,收集和整理如此龐大的字體不僅是為了將來參考,也是為了印刷漢字,整理古籍,編纂字典,整理和研究國內外漢字,它還為制作姓名和證書列表以及在中國地圖上標記地名提供了高水平的字體工具。上世紀90年代初,國家制作了包含20902個字的國家標準字體表,但在使用過程中發現字體表遠遠不夠,目前正在進行補充工作。
整理漢字字庫的原因如下:第壹,滿足建立國際文字的國際要求,制作國際通用字庫,方便國際文字交流。目前,國際ISO國家標準委員會正在收集各國的字符;二是適應計算機輸入法的發展,拓展計算機字庫。目前,信息產業部計算機標準化研究所也正在進行漢字字庫的統計整理工作,已編纂近7萬字;第三,漢字發展過程中的字體變形使壹些文字看起來與漢字不同,需要整理統壹。
世界上有多少漢字?恐怕目前任何人都很難解釋這個問題。
最早的書法書籍是東漢許慎編纂的《說文解字》,共有9353個漢字。《說文解字》的出現使漢字的書寫有了統壹的標準和規範,因此許慎被歷代學者尊為“漢字聖人”。
南北朝時期,南梁顧編纂的《片玉》收詞16917。這本書在唐宋時期進行了修訂,收字數增加到22726字。宋代丁度等人編纂的《廣韻》收字53525字,是古代收字最多的字典。清代張玉書編纂的《康熙字典》收字47035個。辛亥革命後,歐陽普存主編的《漢語大詞典》收字48000余個。
近幾年出版的《漢語大詞典》收錄了56000多個漢字,是迄今為止收錄漢字數量最多的詞典。新編纂的《漢字之海》告訴人們,漢字有近9萬個。這本書因其8.6萬英鎊的收入前綴而被大眾媒體稱為新世界最佳之作。