python-requests模块中常用的解码方式
在得到返回的对象(response)后,一般不去刻意查看,是不知道编码方式的。
通常直接猜即可,因为大多数都是使用的“utf-8”。
在requests里的快捷的解码方式可以使用如下几种:
response.text
类型 : str
解码类型:根据http头部对响应的编码作出推测
修改:response.encoding="utf-8"
response.content.encode()
- 注意:这里encode默认使用“utf-8”
类型 :bytes
解码方式:没指定
- 注意:这是指定解码方式
常见的编码解码方式有:
- ISO-8859-1
- utf-8
是Unicode字符的实现方式之一,它使用1-4个字符表示一个符号,根据不同的符号而变化字节长度
- ASCII码
用来表示英文,它使用1个字节表示,其中第一位规定为0,其他7位存储数据,一共可以表示128个字符。
- GBK/GB2312/GB18030
表示汉字。GBK/GB2312表示简体中文,GB18030表示繁体中文。
- Unicode编码
包含世界上所有的字符,是一个字符集。
pip安装镜像: https://pypi.doubanio.com/simple