跳至主要内容

UnicodeDecodeError: 'gbk' codec can't decode byte 0xa1 in position 23: illegal multibyte sequence

 原因分析

出现这个现象的原因是:在Python中默认的编码方式是“GBK”,而Window中文件创建的默认编码方式为“UTF-8”,所以导致文章无法成功进行读取文件内容。

解决办法

办法一

创建的文件中不含有中文即可。

方法二

进行编码转换,转换成“utf-8”即可。

不过会占用内存,html文件太大时不太适合。

with open('./demo.html', 'r', encoding='utf-8') as f:

result = f.read()

print(result)


评论

此博客中的热门博文

粉色花海,樱花树下,春风拂面,花瓣飘飞如梦。

  樱花盛开,如云雾缭绕,一树绯红似梦幻。细雨轻洒,轻拂花瓣如丝,映衬着淡淡的粉色,如诗如画。微风吹来,花瓣飘落,如梦如幻,萦绕在樱花树下,构成一幅绝美的春日画卷。