壓縮可以分為有損壓縮和無損壓縮。如果個別數據的丟失不會有太大的影響,忽略它們是壹個好主意,這就是有損壓縮。有損壓縮廣泛應用於動畫、聲音和圖像文件,典型代表是mpeg、mp3和jpg。
但更多情況下,壓縮的數據必須準確,所以人們設計了無損壓縮格式,比如常見的zip和rar。壓縮軟件自然是利用壓縮原理壓縮數據的工具。壓縮後生成的文件叫做archive,它的體積只有幾分之壹甚至更小。
當然,壓縮包已經是另壹種文件格式了。如果要使用其中的數據,必須先用壓縮軟件恢復數據。這個過程叫做解壓。常見的壓縮軟件有Winzip、WinRAR等。
擴展數據壹個字節有0-255 * * 256個可能值,三個字節有256 * 256 * 256 * * 1600多萬種可能情況。較長短語的可能值呈指數增長,重復的概率似乎極低。事實上,所有類型的數據都傾向於重復。在壹篇論文中,很少有術語傾向。
壹部小說,人名和地名會反復出現;壹張上下漸變的背景圖片,水平方向的像素會重復出現;在程序的源文件中,語法關鍵詞會重復出現,在以幾十K為單位的未壓縮數據中,往往會出現大量的短語重復。
經過上述壓縮後,短語重復的傾向被完全破壞,所以對壓縮結果的第二次短語壓縮壹般是無效的。
百度百科-壓縮