当前位置: 编程技术>.net/c#/asp.net
提取html中文字 C#自定义函数
来源: 互联网 发布时间:2014-08-30
本文导语: c# 提取html代码中的文字部分。 代码示例: /// /// 去除HTML标记 /// /// 包括HTML的源码 /// 已经去除后的文字 public static string StripHTML(string strHtml) { string [] aryReg ={ @"]*?>.*?", @"", @"([rn])[s]+", @"&(quot|#34);", @"&(amp|#38);", @"&(lt|#60)...
c# 提取html代码中的文字部分。
代码示例:
///
/// 去除HTML标记
///
/// 包括HTML的源码
/// 已经去除后的文字
public static string StripHTML(string strHtml)
{
string [] aryReg ={
@"]*?>.*?",
@"",
@"([rn])[s]+",
@"&(quot|#34);",
@"&(amp|#38);",
@"&(lt|#60);",
@"&(gt|#62);",
@"&(nbsp|#160);",
@"&(iexcl|#161);",
@"&(cent|#162);",
@"&(pound|#163);",
@"&(copy|#169);",
@"(d+);",
@"-->",
@"