首先,在python中字符串的表示是 用unicode編碼。所以在做編碼轉換時,通常要以unicode作為中間編碼。
decode的作用是將其他編碼的字符串轉換成unicode編碼,比如 a.decode('utf-8'),表示將utf-8編碼的字符串轉換成unicode編碼
encode的作用是將unicode編碼的字符串轉換成其他編碼格式的字符串,比如b.encode('utf-8'),表示將unicode編碼格式轉換成utf-8編碼格式的字符串
判斷壹個字符串中是否含有中文字符:
好了,有了以上知識,就可以很容易的解決這個問題了。這是代碼
1?#-*-?coding:utf-8?-*- 2? 3?import?sys 4?reload(sys) 5?sys.setdefaultencoding('utf8') 6? 7?def?check_contain_chinese(check_str): 8?for?ch?in?check_str.decode('utf-8'): 9?if?u'\u4e00'?<=?ch?<=?u'\u9fff':10?return?True
11?return?False
12?
13?if?__name__?==?"__main__":
14?print?check_contain_chinese('中國')
15?print?check_contain_chinese('xxx')
16?print?check_contain_chinese('xx中國')
17?
18?結果:
19?True
20?False
21?True