由於字符數量較多,GB2312采用二維矩陣編碼方式對所有字符進行編碼。首先構造壹個94行94列的方陣,每行稱為壹個“區”,每列稱為壹個“位”,然後按照下表中的規則將所有字符填充到方陣中。
這樣,所有的字符在方陣中都有壹個唯壹的位置,可以用區號和位置號的組合來表示,稱為字符的位置碼。因為定位碼和字符的位置是完全對應的,所以定位碼和字符之間也是壹壹對應的。這樣,所有的字符都可以通過它們的位置代碼轉換成數字編碼信息。
擴展數據:
GB2312的編碼範圍為A1A1-fefe,其中漢字的編碼範圍為B0A1-F7FE。GB2312編碼是我國第壹個漢字編碼國家標準,由國家標準總局於1980發布,於1981年5月開始使用。同時,GB2312碼包含拉丁字母、希臘字母、日語平假名和片假名字母、俄語西裏爾字母等682個全角字符。
分區的意思是:GB2312編碼將包含的字符“分區”,用***94個區域,每個區域包含94位和***8836個碼位。這種表示也稱為位置代碼。
區域01-09包含除漢字以外的682個字符。
區域10-15為空,未使用。
16-55區包含3755個壹級漢字,按拼音排序。
區域56-87包含3008個二級漢字,按部首/筆畫分類。
88-94區是空白的,沒有使用過。
百度百科-字符編碼