中國有多少漢字和同音字?
漢字數量不準確,大概10萬個左右(北京國安咨詢設備公司的漢字庫有91251),每天只用幾千個漢字。據統計,1000常用詞可以覆蓋92%左右的文字材料,2000字可以覆蓋98%以上,3000字已經達到99%。簡化的統計和傳統的統計差別不大。歷史上有8萬多個漢字(也有6萬多個說法),大部分是異體字和生僻字。絕大多數異體字和生僻字已經自然消亡或被規範化,壹般只是偶爾出現在除古漢語以外的人名和地名中。另外,在第壹批簡化字之後,還有壹批“二簡化字”,已經廢止,但仍有少數數字在社會上流行。漢代許慎在《說文解字》中第壹次統計了漢字的數量,* * *收錄了9353個字。後來南朝顧寫的玉片,記載為16917字,在此基礎上修訂的《大廣益會》玉片,據說有22726字。之後,宋代官方編輯的《類篇》收了31319字。另壹部由宋代官方編著的《紀昀》收字53525字,曾是收字最多的壹部書。另外,有些字典的字數更多,比如清代的《康熙字典》,有47035個字。日本《大漢和詞典》有48902個字,附錄有1062個。臺灣省的《漢語大詞典》有49905個詞;《漢語詞典》有54678個單詞。20世紀,漢字的海洋是發表字數最多的,有85000字。在漢字的計算機編碼標準中,中國臺灣省的國家標準CNS11643是目前最大的。目前,(4.0)***包含76067個可驗證的簡體、日文、韓文漢字,但並不普及,僅在戶政系統等少數環境中使用。臺灣和香港常用的大五碼包括13053個繁體字。GB18030是中華人民共和國最新的內碼字符集。GBK包含20912個簡化字、繁體字、日文和韓文,而更早的GB2312包含6763個簡化字。Unicode統壹表意基本字符集包含20,902個漢字,有兩個擴展區,共70,000多個字符。