北京國安咨訊設備公司漢字字庫收入有出處漢字91251個,,1000個常用字能覆蓋約92%的書面資料,2000字可覆蓋98%以上,3000字則已到99%。
初期的漢字系統字數不足,很多事物以通假字表示,使文字的表述存在較大歧義。為完善表述的明確性,漢字經歷了逐步復雜、字數大量增加的階段。
擴展資料:
關於漢字的數量,根據古代的字書和詞書的記載,可以看出其發展情況。
秦代的《倉頡》、《博學》、《爰歷》三篇***有3300字;漢代揚雄作《訓纂篇》有5340字,到許慎作《說文解字》就有9353字了;據唐代封演《聞見記·文字篇》所記,晉呂忱作《字林》有12824字,後魏楊承慶作《字統》有13734字。
南朝時顧野王所撰的《玉篇》據記載***收16917字,在此基礎上修訂的《大廣益會玉篇》則據說有22726字;唐代孫強增字本《玉篇》有22561字。宋代司馬光修《類篇》多至31319字,宋朝官修的《集韻》中收字53525個,曾經是收字最多的壹部書;
清代《康熙字典》有47000多字了;1915年歐陽博存等編著的《中華大字典》有48000多字;1959年日本諸橋轍次主編的《大漢和辭典》有49964字;1971年張其昀主編的《中文大辭典》有49888字;1990年徐仲舒主編的《漢語大字典》有54678字;
1994年冷玉龍等編著的《中華字海》有85000字。臺灣地區教育主管機關編撰的《異體字字典》第五版,內容含正字與異體字,***106230字,是收錄較多漢字的字典。
藍德康和松岡榮誌主編的《漢字海》是目前世界上收錄漢字最多的工具書,正文收列字頭單字102434個,附錄收列字頭單字11112個 。
歷史上出現過的漢字總數有8萬多(也有6萬多的說法),其中多數為異體字和罕用字。絕大多數異體字和罕用字已被規範掉,除古文之外壹般只在人名、地名中偶爾出現。此外,繼第壹批簡化字後,還有壹批“二簡字”,已被廢除,但仍有少數字在社會上流行。
如果學習和使用漢字真的需要掌握七八萬個漢字的音形義的話,那漢字將是世界上沒人能夠也沒人願意學習和使用的文字了。但是《中華字海》壹類字書裏收錄的漢字絕大部分是“死字”,也就是歷史上存在過而今天的書面語裏已經廢置不用的字。
據統計,十三經(《易經》、《尚書》、《公羊傳》、《論語》、《孟子》等13部典籍)全部字數為589283個字,其中不相同的單字字數為6544個字。因此,實際上人們日常使用的漢字不過六千多而已。
在漢字計算機編碼標準中,最大的漢字編碼是臺灣地區的CNS11643,5.0版全字庫可供查詢的字***87,047個漢字、10771個拼音文字及894個符號。臺港民間通用的大五碼收錄繁體漢字13053個。
GB18030是中華人民***和國現時最新的內碼字集,GBK收錄漢字簡體、繁體及20912個,而早期的GB2312收錄簡體漢字6763個。Unicode的中日韓統壹表意文字基本字集則收錄漢字20902個,總數亦高達七萬多字。
百度百科-漢字