8.2 樣式字元集

樣式是由字元集所組成的,要掌握正規表示式,首先要弄清楚字元集的定義,才能清楚地了解某一樣式的涵意。

以下是常用的字元集定義:

. 代表任意字元,但不包括換行字元 \n

* 代表比對成功的次數是 0 或 0 次以上

+ 代表比對成功的次數是 1 或 1 次以上

? 代表比對成功的次數是 0 或 1 次  (若用在其它數量修飾子之後,則表示 "比對採不貪心的模式")

^ 代表字串開頭

$ 代表字串結尾

\ 將其後的字元跳脫,使其回歸原字元的涵義,如:\\  , \. , \@ , \? , \*

| 樣式中的 或

( ) 群集

[0-9] 一個數字字元
[^0-9] 非數字
[a-z] 一個英文小寫字母
[^a-z] 非小寫
[A-Z] 一個英文大寫字母
[^A-Z] 非大寫
[a-zA-Z] 英文字母
[^a-zA-Z] 非英文字母

\d 同 [0-9] 數字
\D 同 [^0-9] 非數字
\w 文字, 同 [a-zA-Z0-9_]
\W 非文字,同 [^a-zA-Z0-9_]

\s 空白字元,同 [ \t\n\r\f]
\S 非空白字元,同 [^ \t\n\r\f]

\b 單字的邊界
\B 非單字的邊界

\xnn 16 進位數 nn
\nnn 8 進位數 nnn

{n} 剛好 n 次
{n, } n 次以上
{n, m} 至少 n 次,但不能超過 m 次