Python读取中文txt文件错误：UnicodeEncodeError: 'gbk' codec can't encode character

2023-11-09 03:18•python•阅读 555

1   with open(file,'r') as f:
2         line=f.readline()
3         i=1
4         while line:
5             line=line.decode('utf-8')
6             print str(i)+":   "+line7             line=f.readline() 
8             i=i+1

用以上代码读取一个包含中文的txt文件时，在正确地读取并打印了六百多行之后，print str(i)+": "+line这一行报错：

UnicodeEncodeError: 'gbk' codec can't encode character u'\u200b' in position 99: illegal multibyte sequence

上网查到http://www.crifan.com/unicodeencodeerror_gbk_codec_can_not_encode_character_in_position_illegal_multibyte_sequence/

据分析，上述代码先decode方法将中文字符转为unicode编码，然后print语句打印时，会将其以默认的gbk进行编码，前六百多行能正确打印，说明能够正常编码成gbk，但存在部分字符不能用gbk编码，改用比gbk更大的字符集gb18030之后就没问题了：

1 print str(i)+": "+line

改为：

1 print str(i)+"   "+line.encode('gb18030')

Python读取中文txt文件错误：UnicodeEncodeError: 'gbk' codec can't encode character

相关推荐

python 读取中文CSV 'gbk' codec can't decode bytes in position 2-3：illegal multibyte sequence

python3报错解决办法：UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multib

python读取文件时提示"UnicodeDecodeError: 'gbk' codec can't decode

vue中引入swiper时出现Can't resolve 'swiper/dist/css/swiper.css'

php中遇到下列错误 ，Fatal error: Can't use function return value in write context，解决办法

[python]UnicodeEncodeError: 'gbk' codec can't encode character '\ufffd'

python UnicodeDecodeError: 'gbk' codec can't decode byte 0x99 in position 87: illegal multibyte sequence异常解决

python的中文文件打开方式‘utf-8’

php中遇到下列错误，Fatal error: Can't use function return value in write context，解决办法