python3报错解决办法:UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multib

wordList = textParse(open('email/ham/%d.txt' % i).read())

在python3中读取文件时报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multibyte sequence

网上各种资料大都显示是文件编码问题,所以就把utf-8,gbk,asicc等各种编码方式都试了一遍,还是没有解决问题。

然后仔细看报错信息,根据decode byte 0xae in position 199看出来好像是文件中某个字节不能解码,问题出来了,文件中包含了非法字符。

打开文件23.txt一看,文件是从第二行开始, 别的都是从第一行开始,删除第一行的空行之后,一切就正常啦。

另外:我的错误和网上的错误不一样,因此调试程序的时候要仔细耐心的检查 要有自己的思路