当前位置:  编程技术>其它

正则 捕获组(capture group)

    来源: 互联网  发布时间:2014-10-15

    本文导语:  捕获组有两种形式 一种是普通的捕获组,不产生歧义的情况下,后面简称捕获组,语法规则:(expression); 另一种是命名捕获组,语法规则:(?expression)或者(?'name'expression),这两种写法是等价的。   1、编号规则 如果没有显式为...

捕获组有两种形式
一种是普通的捕获组,不产生歧义的情况下,后面简称捕获组,语法规则:(expression);
另一种是命名捕获组,语法规则:(?expression)或者(?'name'expression),这两种写法是等价的。
 
1、编号规则
如果没有显式为捕获组命名,即没有使用命名捕获组,那么需要按数字顺序来访问所有捕获组
在只有普通捕获组的情况下,捕获组的编号是按照“(”出现的顺序,从左到右编号的 
 
(d{4})-(d{2}-(dd))
1        1 2          3    3 2
 
上面的正则表达式可以用来匹配格式为yyyy-MM-dd的日期,为了在下表中得以区分,采用了d{2}和dd两种写法
还有一个默认编号为0的组,表示的是正则表达式的整体
用以上正则表达式匹配字符串:2008-12-31
匹配结果为:
编号 命名 捕获组 匹配内容 0   (d{4})-(d{2}-(dd)) 2008-12-31 1   (d{4}) 2008 2   (d{2}-(dd)) 12-31 3   (dd) 31
 
如果对组进行了显式命名,即命名捕获组,那么捕获的内容可以通过组名称来引用
但是如果正则表达式中既使用了普通捕获组,也使用了命名捕获组,那么捕获组的编号就要特别注意,编号的规则是先对普通捕获组进行编号,再对命名捕获组进行编号
 
(d{4})-(?d{2}-(dd))
1        1 3                       2     23
 
用以上正则表达式匹配字符串:2008-12-31
匹配结果为:
编号 命名 捕获组 匹配内容 0   (d{4})-(d{2}-(dd)) 2008-12-31 1   (d{4}) 2008 2   (dd) 31 3 date (?d{2}-(dd)) 12-31
 
 
2、捕获组的引用
对捕获组的引用一般有以下几种
a) 正则表达式中,对前面捕获组捕获的内容进行引用,称为反向引用
b) 正则表达式中,(?(表达式)true|false)的条件表达式
c) 在程序中,对捕获组捕获内容的引用
 
反向引用
对于普通捕获组的引用,语法规则为:k,通常简写为num,其中num是十进制的数字,即捕获组的编号
对于命名捕获组的引用,语法规则为:k或者k'name'

    
 
 
 
本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • Perl 正则表达式之角色化记忆
  • 正则表达式 表示 非指定字符串开头的正则
  • Linux c++ boost库正则表达式用法
  • c#正则过滤图片标签 asp.net正则过滤的例子
  • Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法
  • 正则匹配后面非指定字符的正则 原创
  • linux bash shell命令:文本搜索工具grep正则表达式元字符集(基本集)
  • java使用正则表达校验手机号码示例(手机号码正则)
  • JS 正则表达式的相关方法(正则学习笔记1)
  • js正则表达式之RegExp对象之compile方法 编译正则表达式
  • PHP html标签正则替换并可自定义正则规则
  • jQuery中的正则表达式分析 正则基础
  • 正则表达式问题,使用正则表达式找出指定字符串并替换?
  • 正则表达式概述 什么是正则表达式 .
  • php 正则 不包含某字符串的正则表达式
  • 常用正则表达式及评注-学习正则必备
  • python正则表达式去掉数字中的逗号(python正则匹配逗号)
  • 正则表达式口诀_学习正则的朋友值得一看
  • Javascript里的两种使用正则的方法
  • java 正则表达式基础,实例学习资料收集大全 原创
  • (菜鸟飞飞)问个正则表达式的问题


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3