8105通用規範漢字是國務院頒布的簡體中文字符集。這些漢字是中國每個人都應該認真學習和熟練使用的,尤其是6500個壹、二類常用漢字。國務院頒布已近兩年,但至今沒有媒體部門推廣應用。這種異常情況的原因是什麽?根據我的分析,這都是UTF-8字符集造成的。不可否認,在信息社會初期,UTF-8字符集被采用來解決很多信息交流的問題,被國內網站和文檔數字化公司采用為系統字符集,因為國內電腦的操作系統主要使用微軟產品,WinXP~Win7使用GBK字符集,而UTF-8用簡體字代替了GBK的繁體字。雖然它減少了字符集的容量,但同時也擴大了信息檢索的範圍。文獻數字化不忠於原文,成了半生不熟的工程,未來還得為真正的全文數字化而返工;?不能顯示繁體字,只能在使用簡體字的中國大陸使用,不能被港澳臺和全球華人使用和交流;?可用漢字數量太少,連通用規格的249個漢字都無法顯示,其中4個為二級字;?中日韓漢字不能同屏顯示,日韓文字被篡改成簡化字,句子不倫不類。
Win8的系統字符集已經升級到通用碼第5版,有75000個漢字,但仍然缺少113個通用標準漢字。如果從網上免費下載通用碼第6版超大字符集字體,可以達到76800個漢字的容量,可以顯示所有常用漢字。如果國內網站能拋棄UTF-8,采用新版通用代碼,上述問題就能迎刃而解。預計國內網站將率先推廣應用通用規範的漢字。