當前位置:成語大全網 - 古籍善本 - 壹個漢字怎麽編碼?

壹個漢字怎麽編碼?

1.漢字信息編碼知識

(1)國家標準代碼:指1981出版的《中華人民共和國與中國標準信息交換用漢字代碼》,代碼名稱為“GB2312-80”。由兩個連續的字節組成。

2.內置碼:在計算機中表示漢字的代碼是漢字內置碼,由國標碼演變而來。在代表國標碼的兩個字節的最高位加上“1”,就成了漢字的內置碼。

3.輸入碼:漢字輸入碼是指直接從鍵盤輸入的各種漢字輸入法的代碼,屬於外碼。

4.字體點陣碼:用點陣法構造中文字體,然後存入計算機,形成中文字體庫。目的是顯示和打印漢字。

編碼轉換的示例

漢字定位碼16基礎國家標準碼內碼

Text 4636 2E24H 4E44H CEC4H

文的區號是4636,區號和位置碼用16表示,分別是“2E24H”,00101111000100。

換算成國標代碼“4E44H”,010011100100。

內置代碼為“CEC4H”,1100 1101010100。

回答時間:2006年9月-12 11: 50: 48。

計算機只識別由0和1組成的代碼。ASCII碼是英文信息處理的標準碼,漢字信息處理也必須有統壹的標準碼。中國國家標準局於1981年5月頒布了《信息交換用漢字編碼字符集-基本集》,代號為GB2312-80。* *編碼了6763個漢字和682個圖形字符,其編碼原則是:漢字用兩個字節表示,每個字節用七位碼表示(高位)。國標將漢字和圖形符號排列在94行94列的二維碼表中。每兩個字節用兩位小數編碼,第壹個字節的編碼叫區號,最後壹個字節的編碼叫位碼,稱為區號。如果“寶”字在二維碼表中17區的第三位,則區號為“1703”。

國家代碼不等於區號,而是通過對區號稍加轉換得到的。轉換方法如下:首先將十進制區號和位碼轉換成十六進制區號和位碼;這樣就得到壹個與國標代碼有相對位置差的代碼;這個碼的第壹個字節和第二個字節加20H,就得到國標碼。如:“保”?漢字國家標準碼是3123H,通過以下變換得到:1703d->;1103h->;+20H-& gt;3123H .

國標碼是漢字信息交換的標準碼,但由於其前後字節最高位為0,與ASCII碼沖突,如“保”?字,國標代碼是31H和23H,西文字符“1”和“#”的SCII也是31H和23H。現在如果內存中有兩個字節,它們是31H和23H。這是漢字嗎?,或者兩個西文字符“1”;還有“# ”?所以有歧義。顯然,國家標準代碼不能直接在計算機內部采用。漢字內碼采用變形的國標碼,其轉換方法是:在國標碼的每個字節上加128,即把兩個字節的最高位由0改為1,其余7位不變。舉個例子,從上面我們知道,“寶”字的國家標準代碼是3123H,第壹個字節是018。最後壹個字節為00100011B,高位字節改為1010001B和10101065438。字的內碼是b 1A3H;。