当前位置: 技术问答>linux和unix
libc下的regcomp
来源: 互联网 发布时间:2016-01-10
本文导语: regcomp(&r,"href="/tech-qa-linux/[0-9a-zA-Z/index.html"", REG_EXTENDED | REG_ICASE); 上面编译的正则表达式是用来提取html页面源代码里的href链接的,可以用regcomp编译通过; 但是其实我不想像href="mailto:"和href="javascript:"这类的href,所以又把正则...
regcomp(&r,"href="/tech-qa-linux/[0-9a-zA-Z/index.html"", REG_EXTENDED | REG_ICASE);
上面编译的正则表达式是用来提取html页面源代码里的href链接的,可以用regcomp编译通过;
但是其实我不想像href="mailto:"和href="javascript:"这类的href,所以又把正则表达式改了一下:
regcomp(&r,"href="/tech-qa-linux/(/!mailto__javascript_)[0-9a-zA-Z.html"", REG_EXTENDED | REG_ICASE);
这是这下用regcomp就编译不通过,好像是不支持(?!mailto:|javascript:)这样的表达式,那么请问我该如何提取开头不包含mailto和javascript的href?
上面编译的正则表达式是用来提取html页面源代码里的href链接的,可以用regcomp编译通过;
但是其实我不想像href="mailto:"和href="javascript:"这类的href,所以又把正则表达式改了一下:
regcomp(&r,"href="/tech-qa-linux/(/!mailto__javascript_)[0-9a-zA-Z.html"", REG_EXTENDED | REG_ICASE);
这是这下用regcomp就编译不通过,好像是不支持(?!mailto:|javascript:)这样的表达式,那么请问我该如何提取开头不包含mailto和javascript的href?
|
先提取href後的,再自己分析好了,
您可能感兴趣的文章:
本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。
本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。