歷史上有8萬多個漢字(也有6萬多個說法),其中大部分是異體字和生僻字。絕大多數異體字和生僻字已經自然消亡或被規範化,除古漢語外,壹般只是偶爾出現在人名和地名中。此外,在第壹批簡體字之後,還有壹批“二簡字”,它們已被廢除,但少數數字仍在社會上流行。
漢代許慎在《說文解字》中首次統計了漢字的數量,* * *包括9353個漢字。後來,南朝顧撰寫的玉片被記載為16917字,在此基礎上修訂的《大廣益會》玉片據說有22726字。之後,由宋代官方編輯的《類篇》共收31319字。另壹部由宋代官方編輯的《紀昀》收字53525字,壹度是收字最多的書。
此外,有些字典的字數更多,如清代的《康熙字典》有47035個字。日本的《大漢和詞典》有48,902個單詞,還有65,438+0062個附錄。臺灣省的《漢語大詞典》有49905個字;《漢語詞典》有54678個單詞。20世紀,《漢字之海》發表的字數最多,有8.5萬字。
在漢字的計算機編碼標準中,目前最大的漢字編碼是臺灣省的國家標準CNS11643。目前,(4.0)* *包含76,067個可驗證的簡體、日文和韓文漢字,但並不普及,僅在戶政系統等少數環境中使用。臺灣和香港常用的大五碼包括13053個繁體字。GB 18030是中華人民共和國最新的內碼字符集。GBK包含20912個簡體中文字符、繁體中文字符、日文字符和韓文字符,而早期的GB 2312包含6763個簡體中文字符。統壹碼統壹表意基本字符集包含20,902個漢字,並有兩個擴展區,共70,000多個字符。
早期的漢字系統,字數不足,很多東西都是用通假字來表示的,這就造成了文字表達的模糊性。為了提高表達的清晰度,漢字經歷了壹個逐漸復雜化和字數大量增加的階段。漢字數量的過度增加造成了學習漢字的困難,而單個漢字所能表達的意思是有限的,因此許多單個漢字的意思都是通過漢字詞來表達的,例如常見的雙字。目前,漢語寫作的發展傾向於創造新詞而不是新詞。
根據《辭海》1999版本,共有19485個字(包括繁體字和異體字),其中17674列為前綴。前綴和獨立標題122835;全書篇幅為654.38+0983萬字。《大辭海》是《辭海》的2.5倍,約5000萬字,38卷。2004年底,出版了哲學、醫學和健康、法律和語言學方面的書籍。
因此,很難對漢字進行準確的統計,因為隨著時代的不同,這也導致了漢字數量的增加或減少。