1,#將Unicode轉換成普通的Python字符串:“encode”。
2、?#將普通Python字符串轉換成Unicode:“decode”。
擴展數據:
Python轉換字符和字符串:處理不適合ASCII字符集表示的數據。
在以ASCII碼為中心的語言和環境中,字節和字符被當作壹回事。由於壹個字節只能有256個值,這些環境僅限於支持256個字符的Unicode代碼。另壹方面,有上萬個字符,這意味著每個Unicode字符占用多個字節。因此,妳需要區分字符和字節。
(1)UTF-8編碼可以處理任何Unicode字符。它也是向後兼容ASCII碼的,所以壹個純ASCII碼文件也可以認為是UTF-8文件,壹個恰好只使用ASCII碼字符的UTF-8文件和壹個具有相同字符的ASCII碼文件是壹樣的。
這個特性使得UTF-8非常向後兼容,尤其是在使用舊的Unix工具時。毫無疑問,UTF-8是Unix上的主流編碼。它的主要弱點是對於東方人物來說效率非常低。
(2)微軟操作系統和Java環境下優先選擇UTF-16編碼。對西方語言效率低,對東方語言效率更高。UTF-16的變體有時被稱為UCS-2。
(3)ISO-8859編碼系列是256字符ASCII碼的超集。它們不能支持所有的Unicode代碼字符;它們只能支持壹些特殊的語言或語系。
ISO-8859-1,也稱為拉丁語-1,包括大多數西歐和非洲語言,但不包含阿拉伯語。ISO-8859-2,也稱為拉丁語-2,包括許多東歐語言,如匈牙利語和波蘭語。
參考資料:
百度百科- Unicode