当前位置: 编程技术>.net/c#/asp.net
提取HTML代码中文字的C#函数
来源: 互联网 发布时间:2014-10-12
本文导语: /// /// 去除HTML标记 /// /// 包括HTML的源码 /// 已经去除后的文字 public static string StripHTML(string strHtml) { string [] aryReg ={ @"]*?>.*?", @"", @"([rn])[s]+", ...
///
/// 去除HTML标记
///
/// 包括HTML的源码
/// 已经去除后的文字
public static string StripHTML(string strHtml)
{
string [] aryReg ={
@"]*?>.*?",
@"",
@"([rn])[s]+",
@"&(quot|#34);",
@"&(amp|#38);",
@"&(lt|#60);",
@"&(gt|#62);",
@"&(nbsp|#160);",
@"&(iexcl|#161);",
@"&(cent|#162);",
@"&(pound|#163);",
@"&(copy|#169);",
@"(d+);",
@"-->",
@"
/// 去除HTML标记
///
/// 包括HTML的源码
/// 已经去除后的文字
public static string StripHTML(string strHtml)
{
string [] aryReg ={
@"]*?>.*?",
@"",
@"([rn])[s]+",
@"&(quot|#34);",
@"&(amp|#38);",
@"&(lt|#60);",
@"&(gt|#62);",
@"&(nbsp|#160);",
@"&(iexcl|#161);",
@"&(cent|#162);",
@"&(pound|#163);",
@"&(copy|#169);",
@"(d+);",
@"-->",
@"