python-requests模块中常用的解码方式

2024-02-01 10:35•python•阅读 4278

在得到返回的对象(response)后，一般不去刻意查看，是不知道编码方式的。

通常直接猜即可，因为大多数都是使用的“utf-8”。

在requests里的快捷的解码方式可以使用如下几种：

response.text

类型： str
解码类型：根据http头部对响应的编码作出推测
修改：response.encoding="utf-8"

response.content.encode()

注意：这里encode默认使用“utf-8”

类型：bytes
解码方式：没指定

注意：这是指定解码方式

常见的编码解码方式有：

ISO-8859-1

utf-8

是Unicode字符的实现方式之一，它使用1-4个字符表示一个符号，根据不同的符号而变化字节长度

ASCII码

用来表示英文，它使用1个字节表示，其中第一位规定为0，其他7位存储数据，一共可以表示128个字符。

GBK/GB2312/GB18030

表示汉字。GBK/GB2312表示简体中文，GB18030表示繁体中文。

Unicode编码

包含世界上所有的字符，是一个字符集。

pip安装镜像： https://pypi.doubanio.com/simple

上一篇 »Python Flask的request对象使用详解
下一篇 »Python——request模块