當前位置:成語大全網 - 英語詞典 - python抓取網頁內容時出錯,UnicodeEncodeError: 'gbk' codec can't encode character '\ue4bf.....

python抓取網頁內容時出錯,UnicodeEncodeError: 'gbk' codec can't encode character '\ue4bf.....

問題是這樣的,網頁的數據應該是'utf-8'編碼,這個可以在網頁的head上面看得到,然後妳爬網頁的時候會把它轉化成Unicode,出問題的是在print()這兒,對於print()這個函數,他需要把內容轉化為'gbk'編碼才能顯示出來. 然後解決辦法是這樣,妳在轉化後的Unicode編碼的string後面,加上 .encode('GBK','ignore').decode('GBk') 也就是先用gbk編碼,忽略掉非法字符,然後再譯碼,是不是很有道理 應該是這樣的,因為我和妳遇到同樣的問題,現在解決了