3.7. CNS11643

CNS11643 中文標準交換碼, 一般簡稱 CNS 碼或 CNS11643 , 因中央標準局 公佈及修訂之先後而有二個版本,一般稱為 CNS11643-1986 版(1986公告版)及 CNS11643-1992 版(1992年修訂版), 此二個版本之差異僅在於其所編定之字數不同。 75 年公告之 CNS11643-1986 定義 13,051個漢字(去掉 Big5 多出兩個漢字), 名稱為「通用漢字標準交換碼」 81 年修訂版 CNS11643-1992 擴編為48,027 個漢字, 擴充後修訂名稱為「中文標準交換碼」。

CNS11643 以2個位元組 (byte)為中文碼編碼單位。 字碼中之 00 至 20 以及 7F 均予避開, 則 7bit 字碼集共有 94 個編碼位置, 兩個位元組共可編 8,836 個字碼,訂為一字面。 依字之使用頻率編排於各字面。 依先筆畫後部首排列順序編碼。

CNS11643-1992 可用的編碼法有:ISO-2022-CN、ISO-2022-CN-EXT、 EUC-TW。從某角度來看,可以把 Big5 看成是 CNS11643-1992 第一和第二字面的一種編碼法, 因為 CNS11643 直接取用 Big5 的第一和第二級漢字區, 作為 CNS11643 的第一和第二字面。

目前現有的 CNS11643 七個字面的字型可以在 x11-fonts/intlfonts 中找到, 有 16、24、40 點字等字體大小可以取用。

Table 3-4. ISO-2022-CN 的規格 -1,2

字集 十六進位 圖形字符(ASCII)
CNS 11643-1992 第 1 字面 1B 24 29 47 <ESC> $ ) G
CNS 11643-1992 第 2 字面 1B 24 2A 48 <ESC> $ * H
CNS 11643-1992 第 3 字面 1B 24 2B 49 <ESC> $ + I
CNS 11643-1992 第 4 字面 1B 24 2B 4A <ESC> $ + J
CNS 11643-1992 第 5 字面 1B 24 2B 4B <ESC> $ + K
CNS 11643-1992 第 6 字面 1B 24 2B 4C <ESC> $ + L
CNS 11643-1992 第 7 字面 1B 24 2B 4D <ESC> $ + M
One-byte shift 0F  
Two-byte shift 0E  

Table 3-5. ISO-2022-CN 的規格 -3

移位種類 十六進位 字集
SO 0E CNS 11643-1992 第 1 字面
SS2 1B 4E CNS 11643-1992 第 2 字面
SS3 1B 4F CNS 11643-1992 第 3 至第 7 字面

Table 3-6. 台灣漢字字集規則

字集 公佈時間 第一級 第二級 附加漢字 符號
CCCII 1980 75684      
Big5 1984 5401 7652   441
Big5_ETen 1985 5401 7652 7 808
CNS11643 1992 5401 7650 34976 684

CNS11643 雖然是國家標準,但是如其名的只是個中文標準標換碼, 雖然國內有 文鼎科技 推出 ATE-EUC之政府應用 來給政府的戶政機構使用, 但是由於 CNS11643 的相關資料獲取不易, 加上業界使用 Big5 成習,因此整個中文的編碼環境陷入膠著狀態。

WWW: http://www.cns11643.gov.tw/