因為漢字是壹個開放的集合,數字並不準確,日常生活中使用的漢字數量大約是幾千個。漢代許慎在《說文解字》中首次統計了漢字的數量,* * *包括9353個漢字。後來,南朝顧撰寫的玉片被記載為16917字,在此基礎上修訂的《大廣益會》玉片據說有22726字。之後,由宋代官方編輯的《類篇》共收31319字。另壹部由宋代官方編輯的《紀昀》收字53525字,壹度是收字最多的書。
近代編纂的詞典字數更高,如清代《康熙字典》有47035字。臺灣省的《漢語大詞典》有49905個字;大陸的漢語詞典有54678個單詞;最新的中文單詞Sea包含85568個單詞,包括《漢語大詞典》、《漢語大詞典》、《康熙字典》和《說文解字》中的所有單詞。日本的《大漢和詞典》有48902個單詞,有1062個附錄。在21世紀,日語過去和現在的單詞鏡像的單詞數量最多,為1.5萬個單詞。
在本世紀,第壹批簡體字和第二批“兩個簡體字”被創造出來,其中包括許多社會上的人造字。不過,這兩個簡體字已被內地有關部門廢除,只有少數數字在社會上流行,但目前不包括在計算機編碼中。
在漢字的計算機編碼標準中,目前最大的漢字編碼是臺灣省的國家標準CNS11643。目前,(4.0)* *包含76,067個可驗證的日文、日文和韓文漢字,在戶政系統等官方機構中廣泛使用。臺灣省、香港、澳門等地區大五碼中有13053個正字漢字。GB 18030是中華人民共和國最新的內碼字符集。GBK包含20912個簡體中文字符、繁體中文字符、日文字符和韓文字符,而早期的GB 2312包含6763個簡體中文字符。統壹碼統壹表意基本字符集包含20,902個漢字,並有兩個擴展區,共70,000多個字符。
早期的漢字系統,字數不足,很多東西都是用通假字來表示的,這就造成了文字表達的模糊性。為了提高表達的清晰度,漢字經歷了壹個逐漸復雜化和字數大量增加的階段。過去,對漢字基本要素(上述偏旁部首)的研究和教學比較落後,導致人們難以逐字逐句地學習。漢字越多越難學。形成新詞的風氣越來越保守,也沒有相應的信息處理技術。所以很多單壹的漢語意思都是用詞來表達的,比如常見的雙拼詞。因此,現代寫作的發展傾向於創造新詞而不是新詞。