特別是,文本文件是指以ASCII碼(也稱為文本模式)存儲的文件。更準確地說,英文、數字等字符存儲的是ASCII碼,而漢字存儲的是內碼。文本文件除了有效字符信息(包括回車、換行符和其他可以用ASCII字符表示的信息)之外,不能存儲任何其他信息。
基本介紹中文名:文本文件mbth: text?文件拼音:Wé nB ě né né jià n擴展名:txt,。醫生。,.docx,。wps簡介,格式,ASCII,MIME,。txt,Windows。txt文件,數據存儲,與二進制文件的比較,定義,訪問,優缺點,簡介文本文件是由幾行字符組成的計算機文件。文本文件存在於計算機文件系統中。通常,通過在文本文件的最後壹行後放置文件結束標誌來指示文件的結束。文本文件指的是容器,而純文本指的是內容。文本文件可以包含純文本。壹般來說,計算機文件可以分為兩類:文本文件和二進制文件。格式ASCII ASCII標準允許只包含ASCII字符的文本文件在Unix、Macintosh、Microsoft Windows、DOS等操作系統間自由交互,這對於其他格式的文件是很難做到的。但是,在這些操作系統中,換行符並不相同,對非ASCII字符的處理方式也不壹致。文件MIME文本文件在MIME標準中屬於“文本/普通”類型,並且它通常附有編碼信息。在Mac OS X出現之前,當Resource fork將文件指定為“文本”時,Mac OS將該文件視為文本文件。在Windows中,當文件的擴展名為“txt”時,系統會將其視為文本文件。此外,壹些文本文件出於特殊目的使用其他擴展名。比如計算機的源代碼也是文本文件,它們的後綴用來表示它的編程語言。。txt。txt是包含少量格式信息的文本文件的擴展名。沒有明確的定義。txt格式,通常指那些系統終端或簡單的文本編輯器可以接受的格式。任何可以讀取文本的程序都可以用。txt擴展名,所以壹般認為這類文件是通用的,跨平臺的。在英文文本文件中,ASCII字符集是最常見的格式,在許多情況下,它也是默認格式。對於重音字符和其他非ASCII字符,必須選擇字符編碼。在許多系統中,字符編碼是由計算機的區域設置決定的。常見的字符編碼包括ISO 8859-1,它支持許多歐洲語言。因為很多編碼只能表示有限數量的字符,通常只能用來表示幾種語言。Unicode設定了壹個標準,試圖表達所有已知的語言。Unicode字符集非常大,包括了大多數已知的字符集。Unicode有很多字符編碼,最常見的是UTF-8,向後兼容ASCII,同樣內容的ASCII文本文件和UTF-8文本文件完全壹樣。的。Windows微軟MS-DOS和Windows的txt文件采用相同的文本文件格式,都使用CR和LF作為換行符,這兩個字符對應的ASCII碼分別是13和10。通常,文本的最後壹行不以換行符(CR-LF符號)結束,包括記事本在內的許多文本編輯器都不會在文件末尾添加換行符。大多數Windows文本文件使用ANSI、OEM或Unicode編碼。Windows所指的ANSI編碼通常是1字節的ISO-8859編碼,但對於中文、日文、韓文這樣的環境,則需要2字節的字符集。在過渡到Unicode之前,Windows總是使用ANSI作為系統默認編碼。OEM編碼,也稱為MS-DOS代碼頁,是IBM為早期IBM個人電腦的文本模式顯示系統定義的。在全屏幕MS-DOS程序中,圖形字符和畫線字符都被使用。新版本的Windows可以使用Unicode編碼,如UTF-16LE和UTF-8。由於數據存儲結構簡單,文本文件被廣泛用於記錄信息。它可以避免其他文件格式遇到的壹些問題。此外,當文本文件中的某些信息出錯時,通常更容易從錯誤中恢復並繼續處理其余的信息。文本文件的壹個缺點是它們的熵通常很低,也就是說,它們可以用更少的存儲空間來記錄。相對於二進制文件,計算機存儲在物理學上定義為二進制,所以文本文件和二進制文件的區別不是物理上的,而是邏輯上的。兩者只是編碼層次不同。簡單來說,文本文件是基於字符編碼的文件。常見的編碼有ASCII編碼、UNICODE編碼等。二進制文件是基於值編碼的文件,妳可以根據具體的應用指定壹個值(可以看作是自定義編碼)。從上面可以看出,文本文件基本都是定長編碼的(也有UTF-8等非定長編碼)。基於字符,每個字符都固定在特定的編碼中。ASCII碼是8位碼,UNICODE壹般占16位。二進制文件可以看作是變長編碼,因為是值編碼,多少位代表壹個值完全由妳決定。access text工具打開壹個文件,首先從物理上讀取該文件對應的二進制比特流,然後根據選擇的解碼方法對該流進行解釋,然後顯示解釋結果。壹般來說,妳選擇的解碼方式會是ASCII碼的形式(ASCII碼的壹個字符是8位)。接下來,它將壹次解釋這個文件流8位。記事本無論打開什麽文件都是按照既定的字符編碼(比如ASCII碼)工作的,所以打開二進制文件時難免會出現亂碼,解碼和解碼並不對應。文本文件的存儲和讀取基本上是壹個相反的過程。二進制文件的存取和文本文件類似,只是編碼/解碼方式不同。優缺點因為文本文件和二進制文件的區別只是編碼的區別,所以它們的優劣就是編碼的優劣。壹般來說,文本文件編碼是基於固定長度的字符,易於解碼;二進制文件編碼長度可變,因此靈活,存儲利用率更高,解碼難度更大(不同的二進制文件格式有不同的解碼方法)。在windows下,文本文件不壹定用ASCII碼存儲,因為ASCII碼只能表示128的標識。打開壹個txt文檔,然後將其另存為另壹個選項。您可以選擇存儲格式。壹般來說,UTF-8編碼格式更兼容。二進制中使用的原始計算機語言不存儲兼容性。