跳至主要内容

博文

目前显示的是 六月, 2023的博文

UnicodeDecodeError: 'gbk' codec can't decode byte 0xa1 in position 23: illegal multibyte sequence

 原因分析 出现这个现象的原因是:在Python中默认的编码方式是“GBK”,而Window中文件创建的默认编码方式为“UTF-8”,所以导致文章无法成功进行读取文件内容。 解决办法 办法一 创建的文件中不含有中文即可。 方法二 进行编码转换,转换成“utf-8”即可。 不过会占用内存,html文件太大时不太适合。 with open('./demo.html', 'r', encoding='utf-8') as f: result = f.read() print(result)