zip是什麽格式?ZIP文件格式是壹種用於數據壓縮和文檔存儲的文件格式,原名Deflate,由菲利普·卡茲發明。
他在1989 65438+10月以這種格式發布了信息。ZIP通常使用後綴“.”。zip”,其MIME格式為application/zip。目前,ZIP格式屬於幾種主流壓縮格式之壹,其競爭對手包括RAR格式和開源的7z格式。從性能比較來看,RAR和7z格式比ZIP格式具有更高的壓縮率,7-Zip由於提供了免費的壓縮工具,也逐漸在更多領域得到應用。微軟從Windows ME操作系統開始就內置了對zip格式的支持。即使用戶的電腦上沒有安裝解壓軟件,也可以打開並制作zip格式的壓縮文件。OS X和流行的Linux操作系統也為zip格式提供類似的支持。因此,如果您在網絡上傳播和分發文件,zip格式通常是最常用的選擇。
技術介紹
ZIP是壹種相當簡單的歸檔格式,可以單獨壓縮每個文件。單獨壓縮文件允許在不讀取額外數據的情況下檢索獨立的文件;理論上,這種格式允許不同的算法用於不同的文件。無論使用哪種方法,對這種格式的壹個警告是,當有許多小文件時,歸檔文件將明顯大於壓縮成單個文件(在類Unix系統中的壹個經典例子是,普通的tar.gz歸檔文件由壹個用gzip壓縮的TAR歸檔文件組成)。
ZIP的規範表明文件可以不經壓縮或使用不同的壓縮算法存儲。然而,在實踐中,ZIP幾乎總是使用Katz的DEFLATE算法。
ZIP支持基於對稱加密系統的簡單密碼,已知該密碼存在嚴重缺陷,如明文攻擊、字典攻擊和暴力攻擊。ZIP也支持卷壓縮。
最近,ZIP增加了包括新的壓縮和加密方法在內的新功能,但這些新功能並不被許多任務支持,也沒有得到廣泛應用。
缺點:
由於出現在市場上的時間較早,如今的Zip文件與其他壓縮格式相比,有著許多不可忽視的缺點。
原生用戶不支持Unicode文件名,容易導致壹些資源共享困難,尤其是東亞文化圈。無法與7z相提並論的壓縮比和WinRAR等恢復記錄修復支持功能的缺失也是其下滑的原因。
壓縮法
以下方法:
收縮(方法1)
萎縮是LZW小調整的變種,也受到LZW專利問題的影響。壹直不清楚這項專利是否涵蓋了防收縮,但壹些開源項目(如Info-ZIP)決定謹慎行事,不在默認結構中包含防收縮支持。
減少(方法2-5)
縮減包括壓縮重復字節序列的組合,然後應用基於概率的編碼來獲得結果。
內爆(方法6)
內爆涉及使用滑動窗口來壓縮重復的字節序列,然後使用多個Shannon-Fano樹來壓縮結果。
標記化(方法7)
標記化方法的數量被保留。PKWARE協議沒有為它定義算法。
放氣和增強放氣(方法8和9)
這些方法使用眾所周知的Deflate算法。Deflate允許最大32K的窗口。增強的Deflate允許窗口高達64K。增強版略有成功,但沒有得到廣泛支持。
Deflate比較大小為52.1MiB(使用pkzip for Windows 8 . 00 . 0038版進行測試)。
增強的Deflate比較大小為52.8MiB(使用pkzip for Windows 8 . 00 . 0038版進行測試)。
Pkware數據壓縮庫嵌入(方法10)
官方的ZIP格式規範並沒有給出更多關於PKWARE數據壓縮庫爆炸的信息。
比較大小為61.6MiB(用pkzip for Windows 8 . 00 . 0038版測試,選擇二進制模式)。
方法11
此方法由PKWARE保留。
Bzip2(方法12)
這種方法使用眾所周知的bzip2算法。這種算法比deflate效率高,但是工具不支持(基於Windows平臺)。
比較大小為50.6MiB(使用pkzip for Windows 8 . 00 . 0038版測試)。