當前位置:成語大全網 - 書法字典 - 用於無損數據壓縮的無損壓縮編碼技術

用於無損數據壓縮的無損壓縮編碼技術

Shannon(1948)和Fano(1949)首先闡述並實現了這種編碼,因此被稱為Shannon-Fano算法。

這種方法使用自上而下的編碼方法。首先,按符號的頻率或概率排序,例如A、B、C、D和E,如表1所示。然後用遞歸方法把它分成兩部分,每壹部分的次數大致相同。通過以這種方式編碼獲得的總位數是91。壓縮比約為1.3: 1。

表1香農-法諾算法顯示了符號出現次數(Pi)log2(1/P)。分配的代碼所需的位數是a 15(0.375)1.4150030 b 7(0.175)2.514501.14c 7(0.175)。10 14d 6(0.150)2.7369 110 18e 5(0.125)3.0000 1165438。例如,文本文件和光柵圖像就具有這種特性。詞典的編碼方法有很多種,可以歸納為兩大類。

第壹種字典方法的思想是試圖找出被壓縮的字符序列是否出現在先前輸入的數據中,然後用已經出現的字符串替換重復的部分,其輸出只是指向較早出現的字符串的“指針”。這裏的“字典”是指使用先前處理過的數據來表示編碼過程中遇到的重復部分。這種編碼中的所有算法都基於由亞伯拉罕·倫佩爾和雅各布·齊夫於1977年開發並公布的LZ77算法,例如由Storer和Szymanski於1982年改進的LZSS算法。

第二種算法的思想是試圖從輸入數據中創建壹個“短語字典”。這種短語不壹定是具有特定含義的短語,如“嚴謹、勤奮、求實、創新”和“和平的國家、人民和安全是穩固總統職位的基礎”,但它可以是任何字符的組合。在對數據進行編碼的過程中,當遇到詞典中已經出現的“短語”時,編碼器輸出的是該短語在本詞典中的“索引號”,而不是短語本身。