CNS11643 中文標準交換碼, 一般簡稱 CNS 碼或 CNS11643 , 因中央標準局 公佈及修訂之先後而有二個版本,一般稱為 CNS11643-1986 版(1986公告版)及 CNS11643-1992 版(1992年修訂版), 此二個版本之差異僅在於其所編定之字數不同。 75 年公告之 CNS11643-1986 定義 13,051個漢字(去掉 Big5 多出兩個漢字), 名稱為「通用漢字標準交換碼」 81 年修訂版 CNS11643-1992 擴編為48,027 個漢字, 擴充後修訂名稱為「中文標準交換碼」。
CNS11643 以2個位元組 (byte)為中文碼編碼單位。 字碼中之 00 至 20 以及 7F 均予避開, 則 7bit 字碼集共有 94 個編碼位置, 兩個位元組共可編 8,836 個字碼,訂為一字面。 依字之使用頻率編排於各字面。 依先筆畫後部首排列順序編碼。
CNS11643-1992 可用的編碼法有:ISO-2022-CN、ISO-2022-CN-EXT、 EUC-TW。從某角度來看,可以把 Big5 看成是 CNS11643-1992 第一和第二字面的一種編碼法, 因為 CNS11643 直接取用 Big5 的第一和第二級漢字區, 作為 CNS11643 的第一和第二字面。
目前現有的 CNS11643 七個字面的字型可以在 x11-fonts/intlfonts 中找到, 有 16、24、40 點字等字體大小可以取用。
Table 3-4. ISO-2022-CN 的規格 -1,2
字集 | 十六進位 | 圖形字符(ASCII) |
---|---|---|
CNS 11643-1992 第 1 字面 | 1B 24 29 47 | <ESC> $ ) G |
CNS 11643-1992 第 2 字面 | 1B 24 2A 48 | <ESC> $ * H |
CNS 11643-1992 第 3 字面 | 1B 24 2B 49 | <ESC> $ + I |
CNS 11643-1992 第 4 字面 | 1B 24 2B 4A | <ESC> $ + J |
CNS 11643-1992 第 5 字面 | 1B 24 2B 4B | <ESC> $ + K |
CNS 11643-1992 第 6 字面 | 1B 24 2B 4C | <ESC> $ + L |
CNS 11643-1992 第 7 字面 | 1B 24 2B 4D | <ESC> $ + M |
One-byte shift | 0F | |
Two-byte shift | 0E |
Table 3-5. ISO-2022-CN 的規格 -3
移位種類 | 十六進位 | 字集 |
---|---|---|
SO | 0E | CNS 11643-1992 第 1 字面 |
SS2 | 1B 4E | CNS 11643-1992 第 2 字面 |
SS3 | 1B 4F | CNS 11643-1992 第 3 至第 7 字面 |
Table 3-6. 台灣漢字字集規則
字集 | 公佈時間 | 第一級 | 第二級 | 附加漢字 | 符號 |
---|---|---|---|---|---|
CCCII | 1980 | 75684 | |||
Big5 | 1984 | 5401 | 7652 | 441 | |
Big5_ETen | 1985 | 5401 | 7652 | 7 | 808 |
CNS11643 | 1992 | 5401 | 7650 | 34976 | 684 |
CNS11643 雖然是國家標準,但是如其名的只是個中文標準標換碼, 雖然國內有 文鼎科技 推出 ATE-EUC之政府應用 來給政府的戶政機構使用, 但是由於 CNS11643 的相關資料獲取不易, 加上業界使用 Big5 成習,因此整個中文的編碼環境陷入膠著狀態。