Python如何將Unicode中文字符串轉換成字符串

Unicode字符串可以通過多種方式編碼成普通字符串。假設unicodestring = u"Hello world "，根據選擇的編碼，如下:

1，#將Unicode轉換成普通的Python字符串:“encode”。

2、?#將普通Python字符串轉換成Unicode:“decode”。

擴展數據:

Python轉換字符和字符串:處理不適合ASCII字符集表示的數據。

在以ASCII碼為中心的語言和環境中，字節和字符被當作壹回事。由於壹個字節只能有256個值，這些環境僅限於支持256個字符的Unicode代碼。另壹方面，有上萬個字符，這意味著每個Unicode字符占用多個字節。因此，妳需要區分字符和字節。

(1)UTF-8編碼可以處理任何Unicode字符。它也是向後兼容ASCII碼的，所以壹個純ASCII碼文件也可以認為是UTF-8文件，壹個恰好只使用ASCII碼字符的UTF-8文件和壹個具有相同字符的ASCII碼文件是壹樣的。

這個特性使得UTF-8非常向後兼容，尤其是在使用舊的Unix工具時。毫無疑問，UTF-8是Unix上的主流編碼。它的主要弱點是對於東方人物來說效率非常低。

(2)微軟操作系統和Java環境下優先選擇UTF-16編碼。對西方語言效率低，對東方語言效率更高。UTF-16的變體有時被稱為UCS-2。

(3)ISO-8859編碼系列是256字符ASCII碼的超集。它們不能支持所有的Unicode代碼字符；它們只能支持壹些特殊的語言或語系。

ISO-8859-1，也稱為拉丁語-1，包括大多數西歐和非洲語言，但不包含阿拉伯語。ISO-8859-2，也稱為拉丁語-2，包括許多東歐語言，如匈牙利語和波蘭語。

參考資料:

百度百科- Unicode