当前位置: 技术问答>linux和unix
可不可以 用socket 写一个下载网页的程序
来源: 互联网 发布时间:2017-01-05
本文导语: 就是把网页的源代码一起下载下来 | 网页源代码?是指类似ASP代码那些东西吗? | 有wget能直接镜像整个网站何必自己写 有些商业网站不给你镜像,没关系,咱换wekkit,这是...
就是把网页的源代码一起下载下来
|
网页源代码?是指类似ASP代码那些东西吗?
|
有wget能直接镜像整个网站何必自己写
有些商业网站不给你镜像,没关系,咱换wekkit,这是浏览器的内核,你懂的
不要自己发明轮子
有些商业网站不给你镜像,没关系,咱换wekkit,这是浏览器的内核,你懂的
不要自己发明轮子
|
libcurl
听说很多爬虫都用这个 。
听说很多爬虫都用这个 。
|
照着http协议发请求数据包就可以了
|
可以,看下http协议,像firefox, IE等浏览器就是把Web服务器的网页下载到本地计算机上再显示。
|
可以的,不过不是源代码,而是html源文件,用C/C++写个socket程序,使用的协议是http协议,即将目的主机的端口号写为对应的端口号(默认为80),曾经做过一个小的蜘蛛程序,大概的思路就是这样
|
完全可以实现的。
http基于TCP socket来实现,如果你会写socket程序,搞这个很容易的。
http基于TCP socket来实现,如果你会写socket程序,搞这个很容易的。
|
6楼说的不错,我就是用你说的做出来的,不过网上有很多别的方法也能实现,只是效率的问题