当前位置: 技术问答>linux和unix
tcp抓取网络页面问题
来源: 互联网 发布时间:2015-11-09
本文导语: 需求:先读取指定页面,然后从指定页面的链接读取页面。这么一个程序用c该怎么去做。 | 去看libcurl。 | 就是写一个http的client端程序。写个程序连接服务器80端口,按照http...
需求:先读取指定页面,然后从指定页面的链接读取页面。这么一个程序用c该怎么去做。
|
去看libcurl。
|
就是写一个http的client端程序。写个程序连接服务器80端口,按照http的标准语句读取某个html文件到本地,然后分析文件,找到你要的链接地址,再次发送http请求,读取链接地址对应的文件。你要首先看看http协议。建议阅读computer networking: a top-down approach featuring the internet,Chapter 2
|
http://blog.vckbase.com/michael/archive/2005/11/29/15426.aspx