當前位置:成語大全網 - 英語詞典 - 壓縮文件跟原文件之間大小比例是多少?比如說1.5G的文件壓縮後有多大?

壓縮文件跟原文件之間大小比例是多少?比如說1.5G的文件壓縮後有多大?

這個跟壓縮算法有關,壹般字符文件的壓縮比較高,可以達到50%左右,視頻、音頻、圖像文件,壓縮比壹般80%左右。

如果是影音文件1.5g,壓縮後小不了多少,可能是1.3~1.4G。

有的圖像文件如JPG格式的,本來就是帶壓縮的,再用rar等工具壓縮的效果不明顯,如果是BMP文件,壓縮效果更好。

每個文件都由各種不同代碼組成,比如01代碼。

這類文件只有數字0與1組合。壓縮原理就是通過尋找其中的規律,簡化數字的排列。

比如:00000110001111111111可以簡化成5個0,2個1,3個0,10個1的排列;100000000000可以簡化成數學的:10^10。

根據香農的信息理論,任何壹個文件被無損壓縮後的結果不可能小於其熵(信息論)。

換句話說,如果壹個文件有20多個G的大小,但是其信息熵只有20多M,則實現壹個1000倍的壓縮是完全可能的(比如樓主放出的幾小時全黑視頻);反過來看,壹個文件如果雖然只有100M,但是其信息熵卻高達90M,則這樣的文件是無論如何也不可能被無損壓縮至20M大小的。

多說壹句,壹個文件的信息熵有多少,靠壹個公式是完全可以算出來的。所以只要提供任何壹個文件,我們都能知道它最小可以被壓縮到多少。

以上說法僅限於無損壓縮,對於有損壓縮來說,壓縮了多少倍皆有可能。

擴展資料:

經過壓縮軟件壓縮的文件是壓縮文件,壓縮的原理是把文件的二進制代碼壓縮,把相鄰的0,1代碼減少,比如有000000,可以把它變成6個0的寫法60,來減少該文件的空間。

壓縮文件的基本原理是查找文件內的重復字節,並建立壹個相同字節的"詞典"文件,並用壹個代碼表示,比如在文件裏有幾處有壹個相同的詞"中華人民***和國"用壹個代碼表示並寫入"詞典"文件,這樣就可以達到縮小文件的目的。

其實,所有的計算機文件歸根結底都是以“1”和“0”的形式存儲的,和藍色像點壹樣,只要通過合理的數學計算公式,文件的體積都能夠被大大壓縮以達到“數據無損稠密”的效果。總的來說,壓縮可以分為有損和無損壓縮兩種。

參考資料:

百度百科-壓縮文件