chunked是什麽意思

chunked編碼的基本方法是將大塊數據分解成多塊小數據，每塊都可以自指定長度，其具體格式如下（BNF文法）:

Chunked-Body = *chunk //0至多個chunk

last-chunk //最後壹個chunk

trailer //尾部

CRLF //結束標記符

chunk = chunk-size [ chunk-extension ] CRLF

chunk-data CRLF

chunk-size = 1*HEX

last-chunk = 1*("0") [ chunk-extension ] CRLF

chunk-extension= *( ";" chunk-ext-name [ "=" chunk-ext-val ] )

chunk-ext-name = token

chunk-ext-val = token | quoted-string

chunk-data = chunk-size(OCTET)

trailer = *(entity-header CRLF)

解釋：

Chunked-Body表示經過chunked編碼後的報文體。報文體可以分為chunk, last-chunk，trailer和結束符四部分。chunk的數量在報文體中最少可以為0，無上限；每個chunk的長度是自指定的，即，起始的數據必然是16進制數字的字符串，代表後面chunk-data的長度（字節數）。這個16進制的字符串第壹個字符如果是“0”，則表示chunk-size為0，該chunk為last-chunk,無chunk-data部分。可選的chunk-extension由通信雙方自行確定，如果接收者不理解它的意義，可以忽略。

trailer是附加的在尾部的額外頭域，通常包含壹些元數據（metadata, meta means "about information"），這些頭域可以在解碼後附加在現有頭域之後。

實例分析：

下面分析用ethereal抓包使用Firefox與某網站通信的結果（從頭域結束符後開始）：

Address 0.......................... f

000c0 31

000d0 66 66 63 0d 0a ............... // ASCII碼:1ffc\r\n, chunk-data數據起始地址為000d5

很明顯，“1ffc”為第壹個chunk的chunk-size,轉換為int為8188.由於1ffc後馬上就是

CRLF,因此沒有chunk-extension.chunk-data的起始地址為000d5, 計算可知下壹塊chunk的起始

地址為000d5+1ffc + 2=020d3,如下：

020d0 .. 0d 0a 31 66 66 63 0d 0a .... // ASCII碼:\r\n1ffc\r\n

前壹個0d0a是上壹個chunk的結束標記符，後壹個0d0a則是chunk-size和chunk-data的分隔符。

此塊chunk的長度同樣為8188, 依次類推，直到最後壹塊

100e0 0d 0a 31

100f0 65 61 39 0d 0a...... //ASII碼：\r\n\1ea9\r\n

此塊長度為0x1ea9 = 7849, 下壹塊起始為100f5 + 1ea9 + 2 = 11fa0,如下：

100a0 30 0d 0a 0d 0a //ASCII碼：0\r\n\r\n

“0”說明當前chunk為last-chunk, 第壹個0d 0a為chunk結束符。第二個0d0a說明沒有trailer部分，整個Chunk-body結束。

解碼流程：

對chunked編碼進行解碼的目的是將分塊的chunk-data整合恢復成壹塊作為報文體，同時記錄此塊體的長度。

RFC2616中附帶的解碼流程如下：(偽代碼）

length := 0 //長度計數器置0

read chunk-size, chunk-extension (if any) and CRLF //讀取chunk-size, chunk-extension

//和CRLF

while(chunk-size > 0 ) { //表明不是last-chunk

read chunk-data and CRLF //讀chunk-size大小的chunk-data,skip CRLF

append chunk-data to entity-body //將此塊chunk-data追加到entity-body後

read chunk-size and CRLF //讀取新chunk的chunk-size 和 CRLF

}

read entity-header //entity-header的格式為name:valueCRLF,如果為空即只有CRLF

while （entity-header not empty) //即，不是只有CRLF的空行

{

append entity-header to existing header fields

read entity-header

}

Content-Length:=length //將整個解碼流程結束後計算得到的新報文體length

//作為Content-Length域的值寫入報文中

Remove "chunked" from Transfer-Encoding //同時從Transfer-Encoding中域值去除chunked這個標記

length最後的值實際為所有chunk的chunk-size之和，在上面的抓包實例中，壹***有八塊chunk-size為0x1ffc(8188)的chunk,剩下壹塊為0x1ea9(7849),加起來壹***73353字節。

註：對於上面例子中前幾個chunk的大小都是8188,可能是因為:"1ffc" 4字節，"\r\n"2字節，加上塊尾壹個"\r\n"2字節壹***8字節，因此壹個chunk整體為8196,正好可能是發送端壹次TCP發送的緩存大小。