當前位置:成語大全網 - 古籍修復 - 為什麽有些字辭海裏有而字典裏卻沒有呢?

為什麽有些字辭海裏有而字典裏卻沒有呢?

我國文字從古代的象形文字發展到今天的漢字,中間是經過多次變化和改革的;但是歷代的改革幾乎都是兼收並蓄的,以致使漢字越積越多。當前我國文字之多是非常驚人的,比較常用的《新華字典》就有10000多個漢字;1990年出版的《辭海》有14872個漢字;1716年編撰的《康熙字典》有47035個漢字;郭沫若生前曾根據日本朋友的估計,我國大約有60000多個漢字;1994年出版的《中華字海》有87019個漢字(其中重復字320個);近來,根據北京國安資訊設備公司漢字庫公布,***收入有出處的漢字91251個漢字。其中壹級適用漢字21303個,包括國家標準提出的漢字、我國古今近1200個姓氏6699個漢字和當前鄉村壹級的地名專用字;二級適用漢字36581個,包括古今權威字典中音、義具全的漢字和十三經、二十四史等的古籍用字;三級備用漢字33367個,包括罕用字、異形字、音義未詳字等。尚不包括雜書野史和各地地方誌、名人筆記等自造漢字;還有正、草、隸、篆不同寫法的異體字、同義字等。單據《說文解字》中就有別體字147個。有人估計實際漢字約在10萬個以上;也有人估計在120000個以上;我國究竟有多少漢字至今尚沒有定論。

漢字的數量並沒有準確數字,日常所使用的漢字約為幾千字。據統計,1000個常用字能覆蓋約92%的書面資料,2000字可覆蓋98%以上,3000字時已到99%,簡體與繁體的統計結果相差不大。

歷史上出現過的漢字總數有8萬多(也有6萬多的說法),其中多數為異體字和罕用字。絕大多數異體字和罕用字已自然消亡或被規範掉,除古文之外壹般只在人名、地名中偶爾出現。此外,繼第壹批簡化字後,還有壹批「二簡字」,已被廢除,但仍有少數字在社會上流行。

漢字數量的首次統計是漢朝許慎在《說文解字》中進行的,***收錄9353字。其後,南朝時顧野王所撰的《玉篇》據記載***收16917字,在此基礎上修訂的《大廣益會玉篇》則據說有22726字。此後收字較多的是宋朝官修的《類篇》,收字31319個;另壹部宋朝官修的《集韻》中收字53525個,曾經是收字最多的壹部書。

另外有些字典收字也較多,如清朝的《康熙字典》收字47035個;日本的《大漢和字典》收字48902個,另有附錄1062個;臺灣的《中文大字典》收字49905個;《漢語大字典》收字54678個。20世紀已出版的字數最多的是《中華字海》,收字85000個。

在漢字計算機編碼標準中,目前最大的漢字編碼是臺灣的國家標準CNS11643,目前(4.0)***收錄可考證之繁簡、日、韓語漢字***76,067個,但並不普及,只有在戶政系統等少數環境使用。臺港民間通用的大五碼收錄繁體漢字13053個。GB 18030是中華人民***和國現時最新的內碼字集,GBK收錄簡體、繁體及日語、韓語漢字20912個,而早期的GB 2312收錄簡體漢字6763個。而Unicode的中日韓統壹表意文字基本字集則收錄漢字20902個,另有兩個擴展區,總數亦高達七萬多字。

初期的漢字系統字數不足,很多事物以通假字表示,使文字的表述存在較大歧義。為完善表述的明確性,漢字經歷了逐步復雜、字數大量增加的階段。漢字數量的過度增加又引發了漢字學習的困難,單壹漢字能表示的意義有限,於是有許多單壹的漢語意義是用漢語詞語表示,例如常見的雙字詞。目前漢語書寫的發展多朝向造新詞而非造新字。