当前位置: 编程技术>python
phpsir 开发 一个检测百度关键字网站排名的python 程序
来源: 互联网 发布时间:2014-09-04
本文导语: 源码如下 :保存成utf-8 bd.py 文件 代码如下:#!/usr/bin/env python # -*- coding: utf-8 -*- import sys import urllib ,urllib2 import re def baidu(w): url= "http://www.baidu.com/s?" values = { "w":w.encode('gbk','ignore') } data = urllib.urlencode(values) newurl = url + data response =...
源码如下 :保存成utf-8 bd.py 文件
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import sys
import urllib ,urllib2
import re
def baidu(w):
url= "http://www.baidu.com/s?"
values = {
"w":w.encode('gbk','ignore')
}
data = urllib.urlencode(values)
newurl = url + data
response = urllib2.urlopen(newurl)
the_page = response.read().decode('gbk','ignore')
return the_page
def ana(data,mysite):
o = re.compile("href="/blog_article/(. /).html"")
f = o.findall(data)
line = 1
for ff in f:
if not re.search("baidu",ff) and not re.search("^s?",ff) and re.search("^http://",ff):
if re.search(mysite,ff):
print "* " ,line ,ff
else:
print line ,ff
line += 1
if __name__ == "__main__":
mysite = sys.argv[2]
data = baidu(sys.argv[1].decode('utf-8'))
ana(data,mysite)
用法 python bd.py "关键字" 我的域名部分 :
例:
python bd.py "vbs" ""
代码如下:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import sys
import urllib ,urllib2
import re
def baidu(w):
url= "http://www.baidu.com/s?"
values = {
"w":w.encode('gbk','ignore')
}
data = urllib.urlencode(values)
newurl = url + data
response = urllib2.urlopen(newurl)
the_page = response.read().decode('gbk','ignore')
return the_page
def ana(data,mysite):
o = re.compile("href="/blog_article/(. /).html"")
f = o.findall(data)
line = 1
for ff in f:
if not re.search("baidu",ff) and not re.search("^s?",ff) and re.search("^http://",ff):
if re.search(mysite,ff):
print "* " ,line ,ff
else:
print line ,ff
line += 1
if __name__ == "__main__":
mysite = sys.argv[2]
data = baidu(sys.argv[1].decode('utf-8'))
ana(data,mysite)
用法 python bd.py "关键字" 我的域名部分 :
例:
代码如下:
python bd.py "vbs" ""
您可能感兴趣的文章:
本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。
本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。