在C語言中,char數據是將字符常量放入字符變量中,而不是將字符本身放入內存單元中,而是將字符對應的ASCII代碼放入內存單元中。
在編碼中,壹個漢字存儲需要2個字節。在UTF-8編碼中,壹個英文字母字符存儲需要1字節,壹個中文字符存儲需要3到4字節。在UTF-16編碼中,需要兩個字節來存儲壹個英文字母字符或壹個中文字符。在UTF-32編碼中,世界上任何字符的存儲都需要4個字節。
擴展數據:
由於標準ASCII?字符集中的字符數量有限,在實際應用中往往不能滿足要求。為此,國際標準化組織制定了ISO2022標準,其中規定ASCII?字符集擴展為8位碼的統壹方法。?
ISO先後為不同地區制定了多個擴展ASCII。字符集,每個擴展ASCII字符集可以擴展128個字符,這些擴展字符的代碼都是高位1(即十進制數128~255)的8位代碼,稱為擴展ASCII碼。
百度百科-字符編碼