Python處理兩種不同類型的文件:二進制文件和文本文件。了解兩者之間的差異很重要,因為它們的處理方式不同。
二進制文件
在正常計算機使用期間使用的大多數文件實際上是二進制文件,而不是文本。比如:Microsoft Word .doc文件實際上是壹個二進制文件,即使它只有文本。
二進制文件的其他示例包括:
圖像文件,包括.jpg,.png,.bmp,.gif,等。
數據庫文件包括.mdb,.frm和.sqlite
文件,包括.doc,.xls,.pdf或者其他文件。
那是因為這些文件都有特殊處理的要求,需要特定類型的軟件來打開它。例如,您需要Excel來打開.xls文件,並使用數據庫程序來打開.sqlite文件。
文本文件
壹方面,沒有特定的編碼,可以通過沒有任何特殊處理的標準文本編輯器打開。但是,每個文本文件都必須遵守壹組規則:
文本文件必須是可讀的。他們可以(並且經常會)包含許多特殊編碼,尤其是在HTML或其他標記語言中,但您仍然可以說出它的含義
文本文件中的數據按行組織。在大多數情況下,每壹行都是壹個獨特的元素,無論是指令行還是命令。
此外,文本文件在每行的末尾都有壹個看不見的字符,這使文本編輯器知道應該有壹個新行。通過編程與這些文件交互時,您可以利用該字符。在Python中,它用“ n” 表示。
在哪裏可以找到Python的文件I / O工具
在Python中工作時,您不必擔心導入任何特定的外部庫來處理文件。Python附帶有“文件庫”,文件I / O工具和實用程序是核心語言的內置部分。
但是在其他語言(如C ++)中,要處理文件,您必須通過包含正確的頭文件來啟用文件I / O工具#include <fstream>。如果您使用Java編寫代碼,則需要使用該import java.io.*語句。
使用Python,就沒有必要這樣做,這是因為Python有壹組內置函數,可以處理讀取和寫入文件所需的所有內容。