python-requests模块中常用的解码方式

在得到返回的对象(response)后,一般不去刻意查看,是不知道编码方式的。

通常直接猜即可,因为大多数都是使用的“utf-8”。

在requests里的快捷的解码方式可以使用如下几种:

response.text

类型 : str

解码类型:根据http头部对响应的编码作出推测

修改:response.encoding="utf-8"

response.content.encode()

  • 注意:这里encode默认使用“utf-8”

类型 :bytes

解码方式:没指定

  • 注意:这是指定解码方式

常见的编码解码方式有:

  • ISO-8859-1
  • utf-8

是Unicode字符的实现方式之一,它使用1-4个字符表示一个符号,根据不同的符号而变化字节长度

  • ASCII码

用来表示英文,它使用1个字节表示,其中第一位规定为0,其他7位存储数据,一共可以表示128个字符。

  • GBK/GB2312/GB18030

表示汉字。GBK/GB2312表示简体中文,GB18030表示繁体中文。

  • Unicode编码

包含世界上所有的字符,是一个字符集。

pip安装镜像: https://pypi.doubanio.com/simple