1G = 1024M
1M = 1024K
1K = 1024B
字節是計算機運算的基本單位。
1字節包含8位(二進制位)。
早在其漢字編碼時,Gb2312和BIG5Byte就被用來表示壹個漢字。
但是現在使用的編碼格式是Unicode、Utf-8、Utf-16。
這是壹種國際編碼格式。壹般來說,這種格式的漢字需要3個字節。
這似乎比以前更浪費空間,但事實上,在過去,壹個2字節漢字的編碼語言是沒有標記的。例如,當使用GB2312解碼Big5時,會出現不可讀的亂碼。使用Utf-8時,因為字符的編碼語言已經在編碼中,所以不會出現亂碼。
哪種編碼決定了可以存儲多少漢字,現在又有了壓縮技術,所以可以存儲多少漢字就成了壹個過時的問題。