歷史上出現過的漢字總數有8萬多(也有6萬多的說法),其中多數為異體字和罕用字。絕大多數異體字和罕用字已自然消亡或被規範掉,除古文之外壹般只在人名、地名中偶爾出現。此外,繼第壹批簡化字後,還有壹批“二簡字”,已被廢除,但仍有少數字在社會上流行。
漢字數量的首次統計是漢朝許慎在《說文解字》中進行的,***收錄9353字。其後,南朝時顧野王所撰的《玉篇》據記載***收16917字,在此基礎上修訂的《大廣益會玉篇》則據說有22726字。此後收字較多的是宋朝官修的《類篇》,收字31319個;另壹部宋朝官修的《集韻》中收字53525個,曾經是收字最多的壹部書。
另外有些字典收字也較多,如清朝的《康熙字典》收字47035個;日本的《大漢和字典》收字48902個,另有附錄1062個;臺灣的《中文大字典》收字49905個;《漢語大字典》收字54678個。20世紀已出版的字數最多的是《中華字海》,收字85000個。
在漢字計算機編碼標準中,目前最大的漢字編碼是臺灣的“國家標準”CNS11643,目前(4.0)***收錄可考證之繁簡、日、韓語漢字***76,067個,但並不普及,只有在戶政系統等少數環境使用。臺港民間通用的大五碼收錄繁體漢字13053個。GB18030是中華人民***和國現時最新的內碼字集,GBK收錄簡體、繁體及日語、韓語漢字20912個,而早期的GB2312收錄簡體漢字6763個。而Unicode的中日韓統壹表意文字基本字集則收錄漢字20902個,另有兩個擴展區,總數亦高達七萬多字。