當前位置:成語大全網 - 英語詞典 - 什麽是MPEG4

什麽是MPEG4

MPEG-4標準的主要技術概覽及編碼

摘 要:簡要介紹了MPEG-4標準的主要內容以及在此基礎上著重介紹了音頻對象的編碼和視頻對象的編碼。

關鍵詞:MPEG-4; 多媒體傳輸集成框架; 視頻編碼 0 前言

MPEG-4編碼標準是目前最新的國際編碼標準規範?熏本文就其主要的內容作了簡單的概述?熏並在此基礎上,著重介紹了具有特色的音頻對象的編碼和視頻對象的編碼。

1 多媒體傳輸集成框架

多媒體傳輸集成框架(DMIF)主要解決交互網絡中、廣播環境下以及磁盤中多媒體應用的操作問題,通過傳輸多路合成比特信息,建立客戶端和服務器端的握手和傳輸。與過去不同的是,由於MPEG-4碼流中,包括許多的AV對象,壹般而言,這些AV對象都有各自的緩沖器,而不僅僅是視頻緩沖器和音頻緩沖器。

2 語法描述

MPEG-4定義了壹個句法描述語言來描述AV對象比特流表示和場景描述信息。這個句法描述語言是對C++的擴展,不僅易於表達其AV對象特性,而且也易於軟件仿真實現與模型驗證。與MPEG-4相比,MPEG-1和MPEG-2則采用壹種類C語言的描述,MPEG-4描述語言反映了面向對象技術來描述對象。

3 音頻對象的編碼

視頻音頻的壓縮編碼自然仍是MPEG-4的核心所在。不過,與以前的MPEG-1、MPEG-2不同的是:MPEG-4不僅支持自然的聲音(如語音和音樂),而且支持基於描述語言的合成聲音,支持音頻的對象特征。即壹個場景中,同時有人聲和背景音樂,它們也許是獨立編碼的音頻對象。

3.1 自然聲音編碼

MPEG-4研究比較了現有的各種音頻編碼算法,支持2~64K的自然聲音編碼。如8 kHz采樣頻率的2~4 kbit/s的語音編碼,以及8或16 kHz采樣頻率4~16 kbit/s的音頻編碼,壹般采用參數編碼;6~24 kbit/s的語音編碼,壹般采用碼激勵線性預測(CELP)編碼技術;16 kbit/s以上碼率的編碼,則可采用時頻(T/F)變換編碼技術。這些技術實質上借鑒了已有的音頻編碼標準,如G.723、G.728以及MPEG-1和MPEG-2等。圖1是MPGE4的可伸縮自然音頻編碼器示意圖,包括了3種編碼技術。

3.2 合成聲音

在合成聲音編碼當中,MPEG-4引入了2個極有吸引力的編碼技術:文本到語音編碼和樂譜驅動合成編碼技術。這為網絡上低比特率下交互的帶有語音的遊戲鋪平了道路。事實上,合成聲音編碼技術即是壹種基於知識庫的參數編碼。特別值得壹提的是MPEG-4的樂譜驅動合成技術,在該技術中,解碼器是由壹種特殊的合成語言——結構化的音頻管弦樂團語言(SAOL)驅動的。其中的“管弦樂團”是由不同的“樂器”組成的。當解碼器不具有某壹“樂器”時,MPEG-4還允許解碼器從編碼器下載該“樂器”到解碼器,以便正確恢復合成聲音。可見,MPEG-4不是提供壹組角MIDI音樂標準中的“樂器”,而是提供了壹個可隨時擴充的“管弦樂團”,因此,其可“演奏”樂譜自然更加豐富多彩。

4 視覺對象的編碼

同樣,MPEG-4也支持對自然和合成的視覺對象編碼。合成的視覺對象如2D、3D動畫,人的面部表情動畫等,這些合成圖像單獨編碼,不僅可有效壓縮,而且還便於操作。

對自然視覺對象的編碼,仍是MPEG-4的重點。相對於靜止圖像,MPEG-4采用零樹小波算法(Zerotree WAVelet algorithm)以提供高壓縮比,同時還提供多達11級的空間分辨率和質量的可伸縮性。

對於運動視頻對象的編碼,MPEG-4采用了如圖2所示的編碼框圖,以支持圖像的編碼。

可見,MPEG-4為了支持基於對象的編碼,引入了形狀編碼模塊。為了支持高效壓縮,MPEG-4仍然采用了MPEG-1、MPEG-2中的變換、預測混合編碼框架。

對於壹般的任意形狀的視頻對象,MPEG-4編碼後的碼流結構見圖3。

對於實時的極低比特率的應用,如可視電話,MPEG-4視頻編碼采用極低比特率視頻(VLBV)核進行編碼,類似於ITU的H.263直接對矩形視頻編碼,而不采用形狀編碼模塊。編碼後的碼流結構見圖4

可見,MPEG-4采取了向前兼容H.263,同時,也提供了壹些高層特性,如基於內容的編碼。其擴充的方式見圖5。

MPEG-4支持有誤碼信道傳輸下的魯棒性,提供了更好的同步和誤碼恢復機制。

5 場景描述

場景描述主要用於描述以上單個的AV對象如何在壹個具體AV場景坐標下的組織與同步等問題。同時還有AV對象和AV場景的知識產權保護等問題。

6 MPEG-4展望

MPEG-4的應用將是廣泛而深遠的。這壹新的標準將至少可以應用於以下場合:

a) 實時多媒體監控;

b) 極低比特率下的移動多媒體通信;

c) 基於內容存儲和檢索多媒體系統;

d) Internet/Intranet上的視頻流與可視遊戲;

e) 基於面部表情模擬的虛擬會議;

f) DVD上的交互多媒體應用;

g) 基於計算機網絡的可視化合作實驗室場景應用;

h) 演播室和電視的節目制作。

MPEG系列簡介 (2005-5-30)

MPEG是活動圖象專家組(Moving Picture Coding Experts Group)的簡稱。MPEG成立於1988年1月,是致力於研究、開發數字壓縮標準,以保證活 動圖象質量的前提下,壓縮傳輸碼率的組織。MPEG的第壹次會議在1988年5月召開,有25位音頻、視頻編碼壓縮方面的專家參加。現在MPEG已經成為每年召開3次例行大會(在3月、7月和11月),有來自大約20個國家200多家公司的350名專家參與的組織。MPEG所開發指的標準被國際標準組織(ISO)和國際電工委員會(IEC)批準為國際標準,形成MPEG系列。

MPEG-1

MPEG-1在1989年7月開始研究,1992年被ISO/IEC批準為正式標準,正式標準編號是ISO/IEC11172,MPEG-1規定了在數字存儲介質中實現對活動圖像和聲音的壓縮編碼,編碼碼率最高為每秒1.5兆比特。傳輸速率為1.5Mbits/s,每秒播放30幀,具有CD音質,質量級別基本與VHS(廣播級錄像帶)相當。MPEG的編碼速率最高可達4-5 Mbit/s,但隨著速率的提高,其解碼後的圖像質量有所降低。音頻壓縮格式就是大家熟悉的MP3格式,這種MP3格式規定了與視頻壓縮相分離的音頻壓縮方法 。應用MPEG-1技術最成功的產品非VCD莫屬了,VCD作為價格低廉的影像播放設備,得到廣泛的應用和普及。MPEG-1被用於數字電話網絡上的視頻傳輸,如非對稱數字用戶線路(ADSL),視頻點播(VOD),以及教育網絡等。

MPEG-2

MPEG-2在1991年7月開始研究,是針對標準數字電視和高清晰度電視在各種應用下的壓縮方案和系統層的詳細規定,1992年被ISO/IEC批準為正式標準,正式標準編號是ISO/IEC13818。MPEG-2不是MPEG-1的簡單升級,MPEG-2在系統和傳送方面作了更加詳細的規定和進壹步的完善。MPEG-2能夠提供廣播級的視像和CD級的音質。MPEG-2的音頻編碼可提供左右中及兩個環繞聲道,以及壹個加重低音聲道和多達七個伴音聲道。MPEG-2的另壹特點是,可提供壹個較廣範圍的可變壓縮比,以適應不同的畫面質量、存儲容量以及帶寬的要求。MPEG-2特別適用於廣播級的數字電視的編碼和傳送,被認定為SDTV和HDTV的編碼標準。MPEG-2還專門規定了多路節目的復用分接方式。此外,MPEG-2還兼顧了與ATM信元的適配問題。

MPEG-2標準目前分為9個部分,其中前6部分統稱為ISO/IEC13818國際標準。各部分的內容描述如下:

第壹部分-ISO/IEC13818-1,System:系統,描述多個視頻,音頻和數據基本碼流合成傳輸碼流和節目碼流的方式。

第二部分-ISO/IEC13818-2,Video:視頻,描述視頻編碼方法。

第三部分-ISO/IEC13818-3,Audio:音頻,描述與MPEG-1音頻標準反向兼容的音頻編碼方法。

第四部分-ISO/IEC13818-4,Compliance:符合測試,描述測試壹個編碼碼流是否符合MPEG-2碼流的方法。

第五部分-ISO/IEC13818-5,Software:軟件,描述了MPEG-2標準的第壹、二、三部分的軟件實現方法。

第六部分-ISO/IEC13818-6,DSM-CC:數字存儲媒體-命令與控制,描述交互式多媒體網絡中服務器與用戶間的會話信令集。

第七部分規定了不與MPEG-1多通道音頻編碼反向兼容。?

第八部分原計劃用於10bit視頻抽樣編碼,已停用。?

第九部分規定了傳送碼流的實時。

MPEG-2技術就是實現DVD的標準技術,用於為廣播、有線電視網、電纜網絡以及衛星直播提供廣播級的數字視頻。

MPEG-3

由於MPEG-2的出色性能表現,已能適用於HDTV(高清晰度電視),使得原打算為HDTV設計的MPEG-3,還沒出世就被拋棄了。

MPEG-4

MPEG-4在1995年7月開始研究,1998年11月被ISO/IEC批準為正式標準,正式標準編號是ISO/IEC14496,它不僅針對壹定比特率下的視頻、音頻編碼,更加註重多媒體系統的交互性和靈活性。這個標準主要應用於視像電話、視像電子郵件等,對傳輸速率要求較低,在4800-6400bits/s之間,分辨率為176*144。MPEG-4利用很窄的帶寬,通過幀重建技術、數據壓縮,以求用最少的數據獲得最佳的圖像質量。 利用MPEG-4的高壓縮率和高的圖像還原質量可以把DVD裏面的MPEG-2視頻文件轉換為體積更小的視頻文件。經過這樣處理,圖像的視頻質量下降不大但體積卻可縮小幾倍,可以很方便地用CD-ROM來保存DVD上面的節目。另外,MPEG-4在家庭攝影錄像、網絡實時影像播放也大有用武之地。

MPEG-7

MPEG-7(它的由來是1+2+4=7, 因為沒有MPEG-3、MPEG-5、MPEG-6)於1996年10月開始研究。確切來講,MPEG-7並不是壹種壓縮編碼方法,其正規的名字叫做'多媒體內容描述接口,其目的是生成壹種用來描述多媒體內容的標準,這個標準將對信息含義的解釋提供壹定的自由度,可以被傳送給設備和電腦程序,或者被設備或電腦程序查取。MPEG-7並不針對某個具體的應用,而是針對被MPEG-7標準化了的圖象元素,這些元素將支持盡可能多的各種應用。建立MPEG-7標準的出發點是依靠眾多的參數對圖象與聲音實現分類,並對它們的數據庫實現查詢,就象我們今天查詢文本數據庫那樣。可應用於數字圖書館,例如圖象編目、音樂詞典等;多媒體查詢服務,如電話號碼簿等;廣播媒體選擇,如廣播與電視頻道選取;多媒體編輯,如個性化的電子新聞服務、媒體創作等。

MPEG-21

MPEG在1999年10月的MPEG會議上提出了“多媒體框架”的概念,同年的12月的MPEG會議確定了MPEG-21的正式名稱是“多媒體框架”或“數字視聽框架”,它以將標準集成起來支持協調的技術以管理多媒體商務為目標,目的就是理解如何將不同的技術和標準結合在壹起需要什麽新的標準以及完成不同標準的結合工作。

在數字化趨勢越來越明顯的今天,MPEG的專家們會帶給我們新的MPEG系列,解決在數字化的道路上的不斷出現的問題。