当前位置: 编程技术>其它
正则表达式常用元字符整理小结
来源: 互联网 发布时间:2014-10-17
本文导语: 正则表达式语言由两种基本字符类型组成:原义(正常)文本字符和元字符。元字符使正则表达式具有处理能力。元字符既可以是放在 [] 中的任意单个字符(如 [a] 表示匹配单个小写字符 a ),也可以是字符序列(如 [a-d] 表...
正则表达式语言由两种基本字符类型组成:原义(正常)文本字符和元字符。元字符使正则表达式具有处理能力。元字符既可以是放在 [] 中的任意单个字符(如 [a] 表示匹配单个小写字符 a ),也可以是字符序列(如 [a-d] 表示匹配 a 、 b 、 c 、 d 之间的任意一个字符,而 w 表示任意英文字母和数字及下划线),下面是一些常见的元字符:
. 匹配除 n 以外的任何字符(注意元字符是小数点)。
[abcde] 匹配 abcde 之中的任意一个字符
[a-h] 匹配 a 到 h 之间的任意一个字符
[^fgh] 不与 fgh 之中的任意一个字符匹配
w 匹配大小写英文字符及数字 0 到 9 之间的任意一个及下划线,相当于 [a-zA-Z0-9_]
W 不匹配大小写英文字符及数字 0 到 9 之间的任意一个,相当于 [^a-zA-Z0-9_]
s 匹配任何空白字符,相当于 [ fnrtv]
S 匹配任何非空白字符,相当于 [^s]
d 匹配任何 0 到 9 之间的单个数字,相当于 [0-9]
D 不匹配任何 0 到 9 之间的单个数字,相当于 [^0-9]
[u4e00-u9fa5] 匹配任意单个汉字(这里用的是 Unicode 编码表示汉字的 )
正则表达式限定符
上面的元字符都是针对单个字符匹配的,要想同时匹配多个字符的话,还需要借助限定符。下面是一些常见的限定符 ( 下表中 n 和 m 都是表示整数,并且 0
. 匹配除 n 以外的任何字符(注意元字符是小数点)。
[abcde] 匹配 abcde 之中的任意一个字符
[a-h] 匹配 a 到 h 之间的任意一个字符
[^fgh] 不与 fgh 之中的任意一个字符匹配
w 匹配大小写英文字符及数字 0 到 9 之间的任意一个及下划线,相当于 [a-zA-Z0-9_]
W 不匹配大小写英文字符及数字 0 到 9 之间的任意一个,相当于 [^a-zA-Z0-9_]
s 匹配任何空白字符,相当于 [ fnrtv]
S 匹配任何非空白字符,相当于 [^s]
d 匹配任何 0 到 9 之间的单个数字,相当于 [0-9]
D 不匹配任何 0 到 9 之间的单个数字,相当于 [^0-9]
[u4e00-u9fa5] 匹配任意单个汉字(这里用的是 Unicode 编码表示汉字的 )
正则表达式限定符
上面的元字符都是针对单个字符匹配的,要想同时匹配多个字符的话,还需要借助限定符。下面是一些常见的限定符 ( 下表中 n 和 m 都是表示整数,并且 0