Chapter 3. 中文環境

Table of Contents
3.1. 漢字概論
3.2. 閩南語和客家話
3.3. 編碼標準
3.4. ASCII
3.5. ISO8859-1
3.6. Big5
3.7. CNS11643
3.8. CCCII
3.9. EUC-TW
3.10. GB
3.11. Unicode/ISO 10646
3.12. 基本中文環境的要件
3.13. 國際化與中文化
3.14. 可能的問題

在談中文環境前,必須先正名一下,台灣是 "Taiwan, Republic of China" 或者簡稱 "Taiwan, ROC"、"Taiwan",千萬不要用 "Taiwan, Province of China", 兩者的差異性十分巨大,不管是在民主政治、人權、言論自由等等。

目前常用的中文分為繁體中文與簡體中文。 簡體中文是根據繁體中文,並減少筆劃而產生的。 在台灣有兩千兩百多萬人使用繁體中文, 在中國大陸有十三億三千多萬人使用簡體中文, 而新加坡的三百多萬人和香港的六百多萬人則是兩者都有在使用。

3.1. 漢字概論

漢字是由部首等較小的元件組成的;可以將部首等當作建築積木用。 這些元件可作為構成漢字的基本單位用。漢字使用 214 種部首作索引。

漢字的種類很多;常見的有四種:象形(pictographs)、 指事(simple ideographs)、會意(compound ideographs)、 形聲(phonetic ideographs)。

最基本的是象形字;象形字如同是一張小圖,通常與其所表達的對象很像。 如:日、月、山、火、木、車、口。 而指事字則表達數字和方向等抽象概念或意思。 如:上、下、中、一、二、三。 象形字和指事字可以組成更複雜的字,通常其意思是各個組成部分的意思的綜合, 稱為會意字。 如:林、森、明。 形聲字佔了漢字的 90% 以上,一般至少有兩個部分; 一個是語音,另一個則是字源。 如:銅、洞。 漢字可以合併成詞組,用來表達更複雜的意思或概念。

漢字的發展是以表意的圖畫開始的,並保持字形狀與語意的連結。

Table 3-1. 不同時期的漢字總數

西元 漢字總數 參考文獻
100 9,353 說文解字
1716 47,021 康熙字典
1986 56,000 漢語大字典
1994 85,000 中華字海

兩千年來,漢字的總數增加了將近五倍。在此期間出現的漢字大多數是形聲字。

慣用的日期和時間格式為:年/月/日,由於中華民國在 1911 年創建, 因此年的部分以當年為基礎, 例如:西元2004年12月12日;在台灣會寫成中華民國93年12月12日。 日曆的部分則是採用格里高里曆(Gregorian Calendar)格式, 而年、月、日會被翻成中文。AM 和 PM 也會被翻成中文。

% env LANG=C date
Sun Dec 12 09:59:50 CST 2004
% env LANG=zh_TW.Big5 date
2004年12月12日 周日 09時59分50秒 CST

在台灣使用的幣制是新台幣(New Taiwan Dollar, NTD), 而且每千位會加上一個逗號(,),例如 NTD 1,200。

在美國的姓名是名(first name)在前,姓氏(last name)在後。 但是在台灣則是姓氏在前,名在後。 在姓名中間並沒有空白,而姓氏通常是一個字,但是也有兩個字的, 而名通常是兩個字,但是也有一個字的。 例如:沈俊興(Chun-Hsing Shen)。

地址的部分差異更大。國家在第一個,接著是省份、縣市、街道, 收件人則是姓氏、名,在其上會加上稱謂像是先生、小姐。

No.18, Zunjia Road, Nankan Village, Lujhu Township, Taoyuan County 338, Taiwan (R.O.C.) 
    Mr. Chun-Hsing Shen
中華民國台灣省桃園縣蘆竹鄉南崁村圳佳路 18 號    338
    沈俊興 先生