Unicode:就是要把地球上所有的語言的符號,都用統壹的字符集來表示,壹個編碼真正做到了唯壹。
Unicode裏有幾種方式:
UTF-16BE/LE:UTF-16就是Windows模式的編碼模式(Windows裏說的Unicode壹般都是指這種編碼),用2個字節表示任意字符,註意:英文字符也占2個字節(變態不?),這種編碼可以表示65536個字符,至於LE和BE,就是壹個數值在內存/磁盤上的保存方式,比如壹個編碼0x8182,在磁盤上應該是0x81 0x82呢?還是0x82 0x81呢?就是高位是最先保存還是最後保存的問題,前者為BE,後者為LE。
UTF-8:UTF-8則是網頁比較流行的壹種格式:用壹個字節表示英文字符,用3個字節表示漢字,準確的說,UTF-8是用二進制編碼的前綴,如果某個UTF-8的編碼的第壹個字節的最高二進制位是0,則這個編碼占1字節,如果是110,則占2字節,如果是1110,則占3字節。