asp.net使用mshtml处理html的代码
本文导语: 需要添加.net引用,引用Microsoft.mshtml。 代码: 代码示例: WebClient wc = new WebClient(); wc.Encoding = Encoding.UTF8; string str = wc.DownloadString(@"http://www./article/6290.html"); HTMLDocumentClass doc = new HTMLDocumentClass();//获取html对象 doc.designMode = "on...
需要添加.net引用,引用Microsoft.mshtml。
代码:
WebClient wc = new WebClient();
wc.Encoding = Encoding.UTF8;
string str = wc.DownloadString(@"http://www./article/6290.html");
HTMLDocumentClass doc = new HTMLDocumentClass();//获取html对象
doc.designMode = "on"; //不让解析引擎去尝试运行javascript
doc.IHTMLDocument2_write(str);把html 文档写入html对象中
doc.close();关闭写流
Console.WriteLine(doc.title);输出标题
Console.WriteLine(doc.body.innerText); 输出body
Console.ReadKey();