計算機內部於漢字信息的存儲、運算的信息代碼稱為漢字內碼。處理加工和傳輸漢字時所用的由0和1符號組成的代碼。
1980年發布GB2312-80《信息交換用漢字編碼字符集》。該標準收入了6763個常用漢字(其中壹級漢字3755個,按漢語拼音排序;二級漢字3008個,按偏旁部首排序),以及英、俄、日文字母與其它符號682個,***計7445個字符,是中文信息處理的基礎。
整個字符集分成94個區,每區有94個位,每個區位上有壹個漢字字符,***94*94=8836個漢字字符,用所在的區和位對漢字進行編碼,稱為區位碼。?
所有漢字的區位碼組成壹個94行94列的大表格(不包括標題行和標題列),也可以認為是壹個字典,可以從中查找某個漢字的區位碼。
擴展資料
國標碼的機內碼為二字節長的代碼,它是在相應國標碼的每個字節最高位上加“1”,即:
漢字機內碼=漢字國標碼+8080H。
例如,上述“啊”字的國標碼是3021H,其漢字機內碼則是B0A1H。
漢字機內碼、國標碼和區位碼三者之間的關系為:區位碼(十進制)的兩個字節分別轉換為十六進制後加2020H得到對應的國標碼;漢字交換碼兩個字節的最高位分別加1,即漢字交換碼(國標碼)的兩個字節分別加80H得到對應的機內碼;區位碼(十進制)的兩個字節分別轉換為十六進制後加A0H得到對應的機內碼。
BEDFH-8080H=3E5FH(國標碼),3E5FH-2020H=1E3FH=3063D。