3.10. GB

在中國,中文信息編碼由政府負責制定並監督實施。 這是為了保證對於所有的系統中文的編碼都是一致的,能夠互相進行操作。 從計算機的應用開始,已經頒布了多種中文信息編碼標準, 常用的是 GB2312-1980,GB12345,GB13000(GBK),以及最新標準 18030。 值得一提的是,最新的 GB18030 標準將要作為強制標準實行,所有不支持 GB18030 標準的軟體將不能作為產品的出售。

從 GB2312-1980 編碼開始,漢字都是採用雙字節編碼。 為了與系統中基本的 ASCII 字符集區分開, 所有漢字編碼的每個字節的第一位元都是1, 這個部分與繁體中文相同。例如:"啊" 字的編碼為 0xB0A1。

Table 3-9. GB 的漢字編碼規則

編碼 第一個字節 第二個字節 第三個字節 第四個字節
GB2312 0xB0 - 0xF7 0xA0 - 0xFE    
GBK 0x81 - 0xFE 0x40 - 0xFE    
GB18030 的雙字節 0x81 - 0xFE 0x40 - 0x7E, 0x80 - 0xFE    
GB18030 的四字節 0x81 - 0xFE 0x30 - 0x39 0x81 - 0xFE 0x30 - 0x39