當前位置:成語大全網 - 新華字典 - 漢字區位碼是什麽?

漢字區位碼是什麽?

漢字區位碼是采用壹種科學可行的辦法,為每個漢字編壹個唯壹的代碼,以便計算機辨認、接收和處理。

相關介紹:

所謂漢字編碼,就是采用壹種科學可行的辦法,為每個漢字編壹個唯壹的代碼,以便計算機辨認、接收和處理。在此介紹的是《國家標準信息交換漢字編碼》。這種編碼經過加工整理壹律以漢語拼音的字母為序,音節相同的字以使用頻率為序,其查找方法與壹般漢語字典的漢字拼音音節索引查找法相同。

為了使每壹個漢字有壹個全國統壹的代碼,1980年,我國頒布了第壹個漢字編碼的國家標準: GB2312-80《信息交換用漢字編碼字符集》基本集,這個字符集是我國中文信息處理技術的發展基礎,也是目前國內所有漢字系統的統壹標準。

由於國標碼是四位十六進制,為了便於交流,大家常用的是四位十進制的區位碼。所有的國標漢字與符號組成壹個94×94的矩陣。在此方陣中,每壹行稱為壹個"區",每壹列稱為壹個"位",因此,這個方陣實際上組成了壹個有94個區(區號分別為1到94)、每個區內有94個位(位號分別為1到94)的漢字字符集。

壹個漢字所在的區號和位號簡單地組合在壹起就構成了該漢字的"區位碼"。在漢字的區位碼中,高兩位為區號,低兩位為位號。 在區位碼中,01-09區為682個特殊字符,16~87區為漢字區,包含6763個漢字 。

其中16-55區為壹級漢字(3755個最常用的漢字,按拼音字母的次序排列),56-87區為二級漢字(3008個漢字,按部首次序排列)。

所以,當我們需要n個任意漢字時,我們不必建壹個全部漢字表,而是利用區位碼實現常用漢字的提取。