当前位置:  编程技术>.net/c#/asp.net

C#正则表达式匹配HTML中的图片路径,图片地址代码

    来源: 互联网  发布时间:2014-10-25

    本文导语:  一般来说一个 HTML 文档有很多标签,比如“”、“”、“”等,想把文档中的 img 标签提取出来并不是一件容易的事。由于 img 标签样式变化多端,使提取的时候用程序寻找并不容易。于是想要寻找它们就必须写一个非常健全...

一般来说一个 HTML 文档有很多标签,比如“”、“”、“”等,想把文档中的 img 标签提取出来并不是一件容易的事。由于 img 标签样式变化多端,使提取的时候用程序寻找并不容易。于是想要寻找它们就必须写一个非常健全的正则表达式,不然有可能会找得不全,或者找出来的不是正确的 img 标签。
我们可以从 HTML 标签的格式去想应该怎么建这个正则表达式。首先要想一下 img 标签有几种写法,忽略大小写不看的话,下面列出 img 标签可能出现的几种情况。

这一些标签不用考虑,因为没有图片资源地址。

这一些标签都有图片资源地址,另外还有一个特点就是有引号对,可能为单引号,也可能为双引号。因为不需要同时匹配引号对,所以正则表达式可以这么写:@""

因为 img 和 src 之间可能会有其他的参数,所以“
像这种可能会用回车符折行的问题有时候会出现,所以在有空格分开的地方要包含回车换行和 TAB 字符,另外在图片地址中不能出现空格、TAB、回车和换行字符。所以上面的正则表达式可以改成:@""
下面写出取得HTML中所有图片地址的静态方法。

代码如下:

///          /// 取得HTML中所有图片的 URL。
        ///          /// HTML代码         /// 图片的URL列表         public static string[] GetHtmlImageUrlList(string sHtmlText)
        {
            // 定义正则表达式用来匹配 img 标签             Regex regImg = new Regex(@"", RegexOptions.IgnoreCase);

            // 搜索匹配的字符串             MatchCollection matches = regImg.Matches(sHtmlText);

            int i = 0;
            string[] sUrlList = new string[matches.Count];

            // 取得匹配项列表             foreach (Match match in matches)
                sUrlList[i++] = match.Groups["imgUrl"].Value;

            return sUrlList;
        }


    
 
 

您可能感兴趣的文章:

  • c#正则过滤图片标签 asp.net正则过滤的例子
  • C# 正则表达式读取Discuz帖子中附件的代码举例
  • c#匹配整数和小数的正则表达式
  • C# 正则判断一个数字的格式是否有逗号的代码
  • C#匹配中文字符串的4种正则表达式分享
  • c#转义字符串中的所有正则特殊字符方法示例
  • c# 正则指引--字符组
  • c#正则判断字符是否为中文的三种方法
  • C#的正则表达式Regex类使用简明教程
  • asp.net(c#) 使用Rex正则来生成字符串数组的代码
  • C#正则表达式分解和转换IP地址实例(C#正则表达式大全 c#正则表达式语法)
  • c#字符串使用正则表达式示例
  • C#正则表达式使用方法示例
  • c#判断字符是否为中文的三种方法分享(正则表达式判断)
  • 常用正则 常用的C#正则表达式
  • c#使用正则表达式匹配字符串验证URL示例
  • C#正则表达式获取下拉菜单(select)的相关属性值
  • c# 正则表达式 验证数字的方法
  • C#正则表达式的递归匹配分析
  • C#常用正则大全分享
  • PHP正则匹配图片并给图片加链接详解
  • JS点击图片改变图片图径并用正则表达式取图片名的代码
  • 正则表达式提取图片路径 并过滤掉指定字符的写法
  • 取图片路径的正则
  • php利用正则表达式取出图片的URL
  • EditPlus 正则替换图片ubb替换成img
  • 得到连接和图片的地址 正则
  • asp.net 正则表达式匹配图片路径的实现代码
  • 关于内容的分离,正则抽出图片(一定要加精哦)
  • asp 图片正则 替换,替换前检查图片是不是本地地址的方法
  • PHP正则提取不包含指定网址的图片地址的例子
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • Perl 正则表达式之角色化记忆
  • js正则表达式之RegExp对象之compile方法 编译正则表达式
  • Linux c++ boost库正则表达式用法
  • 正则表达式 表示 非指定字符串开头的正则
  • Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法
  • 正则表达式问题,使用正则表达式找出指定字符串并替换?
  • linux bash shell命令:文本搜索工具grep正则表达式元字符集(基本集)
  • 正则表达式概述 什么是正则表达式 .
  • JS 正则表达式的相关方法(正则学习笔记1)
  • jQuery中的正则表达式分析 正则基础
  • java 正则表达式基础,实例学习资料收集大全 原创
  • 哪些命令可以使用正则表达式
  • 常用正则表达式及评注-学习正则必备
  • (菜鸟飞飞)问个正则表达式的问题
  • 向大家推荐一个收集整理正则表达式的网站
  • 正则表达式的问题
  • 关于正则表达式匹配问题
  • Python 匹配任意字符(包括换行符)的正则表达式写法
  • php 正则 不包含某字符串的正则表达式
  • Java正则表达式 reb4j
  • 大虾,请问谁有正则表达式的资料?谢谢!
  • 正则匹配后面非指定字符的正则 原创
  • java使用正则表达校验手机号码示例(手机号码正则)
  • PHP html标签正则替换并可自定义正则规则
  • python正则表达式去掉数字中的逗号(python正则匹配逗号)
  • 正则表达式口诀_学习正则的朋友值得一看
  • Javascript里的两种使用正则的方法
  • 寻求正则表达试
  • 学习IP地址的正则表达式
  • asp.net正则表达式提取中文的代码示例
  • 正则表达式中使用变量赋值


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3