因此理論上說如果編輯器未放置任何標記是不可能知道文件的原始字符編碼的,就好像妳初次看壹份密碼加密過的文件時妳也不可能知道它是什麽加密方式壹樣,因為編碼方式並不會和編碼的數據放在壹起的。
正常的方法是當妳讀取壹個文件時,應該有人已經告訴了妳這個文件是字符集是什麽。這個過程應該是人工決定的,比如人們把它寫在壹個配置文件中,或者約定了整個軟件只使用 UTF8 或 GBK 壹種編碼方式。作為壹個通用型的軟件推薦使用 UTF8 而不是 GBK,因為當妳保存壹個人名時妳也知道這片神奇的土地上就是有些父母給孩子取名字時用壹些中小學生字典上都找不到的字。這時GBK是無法保存這個漢字的。妳不希望將來自己的軟件碰到這個問題吧,解決的辦法就是這麽簡單,用 UTF8就可以了。