造成這個問題的原因是,txt文件是在Windows環境下生成的,Ubuntu中的vim、gedit等文本閱讀器無法自動識別文件編碼格式。
以下是幾種可能的解決方案。
使用dos2unix unix2dos uni2mac等命令將txt文件從源操作系統轉換到目標操作系統。
如果這些命令不存在,請使用以下命令安裝它們。
使用以下命令進行格式轉換:
這種轉換將改變原始文件的壹些屬性,比如生成時間。如果需要從兩個不同的操作系統訪問文件,這種解決方案就不合適。
這個解決方案適合我這樣的vim愛好者。
Gedit是Ubuntu下功能強大的文本編輯軟件。直接用gedit打開中文txt文件是最吸引人的解決方案。
其實這個方案更簡單。
首先,chardet3用於檢測文件的編碼格式。
運行結果表明,該文件的編碼格式為GB2312:
了解編碼格式後,可以在運行gedit時添加編碼選項,如下所示
也可以正常打開txt文件,如下圖所示。