当前位置:  编程技术>python

python3访问sina首页中文的处理方法

    来源: 互联网  发布时间:2014-09-04

    本文导语:  代码如下:"""如果只用普通的import urllib.requesthtml = urllib.request.urlopen("http://www.sina.com").read()print(html.decode('gbk')) 出现下面的错误builtins.UnicodeDecodeError: 'gbk' codec can't decode byte 0x8b in position 1: illegal multibyte sequence 怎么办?原来是有...

代码如下:

"""
如果只用普通的
import urllib.request
html = urllib.request.urlopen("http://www.sina.com").read()
print(html.decode('gbk'))

出现下面的错误
builtins.UnicodeDecodeError: 'gbk' codec can't decode byte 0x8b in position 1: illegal multibyte sequence

怎么办?原来是有的网站将网页用gzip压缩了 。
请看下面的代码

建议大家用python2
import urllib2
from StringIO import StringIO
import gzip

request = urllib2.Request('http://www.sina.com')
request.add_header('Accept-encoding', 'gzip')
response = urllib2.urlopen(request)
if response.info().get('Content-Encoding') == 'gzip':
    buf = StringIO( response.read())
    f = gzip.GzipFile(fileobj=buf)
    data = f.read()
print data.decode("GBK").encode('utf-8')
"""

import io
import urllib.request as r
import gzip
req = r.Request("http://www.sina.com", headers={"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36", "Accept-Encoding": "gzip"})
bs = r.urlopen(req).read()
bi = io.BytesIO(bs)
gf = gzip.GzipFile(fileobj=bi, mode="rb")
print(gf.read().decode("gbk"))


    
 
 

您可能感兴趣的文章:

 
本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • Python3中内置类型bytes和str用法及byte和string之间各种编码转换
  • gvim7.3支持python3的问题
  • Python3通过request.urlopen实现Web网页图片下载
  • 新装python3在Ubuntu中左右键显示乱码
  • 在Python3中使用urllib实现http的get和post提交数据操作
  • Python3实现生成随机密码的方法
  • python3编写C/S网络程序实例教程
  • python3.3实现乘法表示例
  • python3.0 字典key排序
  • 一则python3的简单爬虫代码
  • Python3实现的腾讯微博自动发帖小工具
  • python3使用urllib示例取googletranslate(谷歌翻译)
  • Python3实现连接SQLite数据库的方法
  • 让python同时兼容python2和python3的8个技巧分享
  • python3图片转换二进制存入mysql
  • python3.3教程之模拟百度登陆代码分享
  • python3使用tkinter实现ui界面简单实例
  • Mac OS X10.9安装的Python2.7升级Python3.3步骤详解
  • Python3.0与2.X版本的区别实例分析
  • python3.3使用tkinter开发猜数字游戏示例
  • Python3基础之条件与循环控制实例解析


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3