漢字在電腦上是怎麽編碼的?
所謂編碼,就是將字符按固定順序排列,作為記錄、存儲、傳輸和交換的統壹內部特征。這個字符序列稱為“編碼”。字體的編碼是字體組織和文字處理的基礎。不同的國家和地區有不同的編碼標準。與中文字體相關的常用編碼有:單字節編碼、GB2312-80、GB12345-90、GBK、U nicode編碼、ISO10646/Unicode字符集、GB 18030-。下面簡單介紹壹下:單字節編碼MS Windows:Windows Latin 1(ANSI)MS-DOS:MS-DOS Latin US Macintosh:Macintosh Roman GB2312-80全稱是GB 2312-80“信息交換”。《漢字編碼基本字符集》公布於1980,是中文信息處理的國家標準,也是唯壹在使用簡體中文的中國大陸和海外地區(如新加坡)強制使用的中文編碼。P-Windows3.2和Apple OS使用GB2312作為基本漢字編碼,而Windows 95/98使用GBK作為基本漢字編碼,但兼容GB2312。雙字節編碼範圍:a 1a 1 ~ FEFE a 1-A9:符號區,包含682個符號B0-F7:漢字區,包含6763個漢字。GB碼* * *包含6763個簡化字和682個符號,其中漢字部分:壹級字3755個。該標準的制定和應用對規範和推動中國信息化進程起到了巨大的作用。GB12345-90 1990制定了繁體字編碼標準GB12345-90《信息交換用漢字編碼字符集第壹輔助集》,旨在規範各種必須使用繁體字的場合,整理古籍。標準* * *包含6866個漢字(比GB 2312多103個字,不包含在其他廠商的字體中),純、繁體字約2200個。雙字節編碼範圍:a 1a 1 ~ FEFE a 1-A9:符號區,增加豎線符號B0-F9:漢字區,國際標準化組織(ISO)於1984年4月成立了壹個ISO/IEC JTC1/SC2/WG2工作組,包含6866個漢字Unicode編碼字符集,對各國的文字和符號進行統壹編碼。1991,美國跨國公司成立Unicode Consortium,與WG2在1991,10達成協議,采用相同的碼字集。目前Unicode采用16位編碼體系,字符集內容與ISO1 0646的BMP(基本多語言平面)相同。Unicode在1992年6月通過了DIS(Draf國際標準),當前版本V2.0在1996年6月發布。內容包括6811符號,209 02漢字,1172韓文拼音。羮O10646/Unicode字符集是壹種編碼字符集,可以在全世界* * *享用。UCS-4:組八位平面八位行八位UCS-2: 00組中的00平面是基本多語種平面(BMP),4E00~9FFF中日韓字符EXTA (CJK): 3400 ~ 4Db7,* * 6584字符EXTB(CJK):42807個漢字,第二個平面中的中文內碼規範(0100~A836 GBK)是中國大陸制定的新的中文碼擴展國家標準,它是GBK工作組在1995 10和同年的12完成了GBK規範。本編碼標準兼容GB2312,* *包含21003個漢字和883個符號,提供1894個造字碼點。簡體和繁體漢字集成到壹個庫中。GBK用於Windows95/98簡體中文版中字體的表面編碼,通過GBK和UCS對應的碼表與底層字體連接。英文名:中文內碼規範中文名:漢字內碼擴展規範1.0版雙字節編碼,擴展GB2312-80,碼點方面兼容GB 2312-80:8140 ~ FEFE(不含X27F) * * * 23940碼點包含21003個漢字。包含ISO/IEC 65438所有中、日、韓文字符+00646-1 GB 18030-2000英文名:中文名:信息技術信息交換用漢字編碼字符集基本集擴展(2000-03-17發布實施)字節、雙字節、四字節編碼兼容國家標準GB 2312信息處理交換碼。在詞匯上,支持GB 13000.1的所有中文、日文和韓文(CJK)統壹漢字以及擴展為A的所有CJK統壹漢字。BIG5編碼是臺灣省和香港地區常用的繁體字編碼標準,包括440個符號,其中壹級漢字5401,二級漢字7652,* *漢字13060。