早期的漢字系統,字數不足,很多東西都是用通假字來表示的,這就造成了文字表達的模糊性。為了提高表達的清晰度,漢字經歷了壹個逐漸復雜化和字數大量增加的階段。
擴展數據:
關於漢字的數量,根據古代字典和詞典的記錄,我們可以看到它們的發展。
倉頡有3300個單詞,秦代有博學和歷法。漢代楊雄的《荀辯》有5340個字,許慎的《說文解字》有9353個字。根據唐代《文健文姬篇》的篆刻表現,晉寫《子林》65,438+02,824字,魏楊成慶寫《梓潼》65,438+03,734字。
據記載,南朝顧撰寫的玉片共16917字,在此基礎上修訂的《大廣益會》玉片據說有22726字。《玉片》是唐代孫強的增補本,共225,665,438+0字。宋代司馬光主編的《類篇》多達365,438+0,365,438+09字,宋代官員主編的《紀昀》多達53,525字,壹度是字數最多的書。
清代《康熙字典》有47000多字。1915歐陽伯存主編的《漢語大詞典》有48000多字;1959日本橋津治主編的《大漢和詞典》共49964字;在1971年,張其昀主編的《漢語詞典》有49888個單詞。1990年徐中書主編的《漢語大詞典》有54678個字;
1994冷玉龍主編的《漢字之海》有85000字。臺灣省教育主管部門編纂的第五版《異體字字典》收錄了正體字和異體字,共***106230個字,是收錄漢字較多的字典。
藍和松岡主編的《漢字海》是目前世界上漢字數量最多的工具書,正文中共有102434個字首詞,附錄中共有1112個字首詞。
歷史上有8萬多個漢字(也有6萬多個說法),其中大部分是異體字和生僻字。絕大多數的異體字和生僻字都已經標準化了,只有古漢語例外,它們壹般只是偶爾出現在人名和地名中。此外,在第壹批簡體字之後,仍有壹批“二簡字”,它們已被廢除,但仍有少數數字在社會上流行。
如果學習和使用漢字真的需要掌握七八萬個漢字的音、形、義,那麽漢字將是世界上沒有人能夠也不會學習和使用的文字。然而,《中國字書》中收錄的漢字大多是“死字”,即歷史上存在過的、在今天的書面語中被廢棄的字。
據統計,十三經(易經、尚書、公羊傳、論語、孟子等13部古籍)中共有589283個字,其中異體字6544個。因此,事實上,人們每天只使用六千多個漢字。
在漢字的計算機編碼標準中,最大的漢字編碼是臺灣省的CNS11643,全字庫5.0版本可查詢87047個漢字、10771個拼音字符和894個符號。臺灣和香港常用的大五碼包括13053個繁體字。
GB18030是中華人民共和國最新的內碼字符集。GBK包含簡體中文字符、繁體中文字符和20912,而早期的GB2312包含6763個簡體中文字符。Unicode的中日韓統壹表意基本字符集包含20,902個漢字,共7萬多個字符。
百度百科-漢字