當前位置:成語大全網 - 新華字典 - 文本格式ANSI,Unicode等有什麽區別

文本格式ANSI,Unicode等有什麽區別

ANSI:最早的時候計算機ASCII碼只能表示256個符號(含控制符號),這個字符集表示英文字母足夠,其中,我們鍵盤上可見的符號的編碼範圍是從32到126(大小寫英文字母、數字、英文符號等)。但表示漢字、日語、韓語就不太夠用了,漢字常用字有3000多個。

Unicode:就是要把地球上所有的語言的符號,都用統壹的字符集來表示,壹個編碼真正做到了唯壹。

Unicode裏有幾種方式:

UTF-16BE/LE:UTF-16就是Windows模式的編碼模式(Windows裏說的Unicode壹般都是指這種編碼),用2個字節表示任意字符,註意:英文字符也占2個字節(變態不?),這種編碼可以表示65536個字符,至於LE和BE,就是壹個數值在內存/磁盤上的保存方式,比如壹個編碼0x8182,在磁盤上應該是0x81 0x82呢?還是0x82 0x81呢?就是高位是最先保存還是最後保存的問題,前者為BE,後者為LE。

UTF-8:UTF-8則是網頁比較流行的壹種格式:用壹個字節表示英文字符,用3個字節表示漢字,準確的說,UTF-8是用二進制編碼的前綴,如果某個UTF-8的編碼的第壹個字節的最高二進制位是0,則這個編碼占1字節,如果是110,則占2字節,如果是1110,則占3字節。