报错'gb2312' codec can't decode byte 0x9e in position 4100: illegal multibyte sequence,“gb2312”编解码器无法解码位置4100中的字节0x9e:非法的多字节序列

风花雪月
• 阅读 1774

“gb2312”编解码器无法解码位置4100中的字节0x9e:非法的多字节序列。

处理方式: with open(path, encoding="utf8", errors='ignore') as f:

使用errors='ignore'去掉(忽略)字符并返回不带字符的字符串。

点赞
收藏
评论区
推荐文章
浅梦一笑 浅梦一笑
5个月前
初学 Python 需要安装哪些软件?超级实用,小白必看!
编程这个东西是真的奇妙。对于懂得的人来说,会觉得这个工具是多么的好用、有趣,而对于小白来说,就如同大山一样。其实这个都可以理解,大家都是这样过来的。那么接下来就说一下python相关的东西吧,并说一下我对编程的理解。本人也是小白一名,如有不对的地方,还请各位大神指出01名词解释:如果在编程方面接触的比较少,那么对于软件这一块,有几个名词一定要了解,比如开发环
CuterCorley CuterCorley
1年前
Python Django开发 异常及解决办法(三)
1.Django2.2报错'gbk'codeccan'tdecodebyte0xa6inposition9737在使用Django时,可能会报错如下:pythonFile"C:\Users\LENOVO\.virtualenvs\Django_FrameworkwC9HNSeq\lib\sitepackages\django
Stella981 Stella981
1年前
Django2.2 报错:UnicodeDecodeError 解决方法
Django2.2报错:UnicodeDecodeError:'gbk'codeccan'tdecodebyte0xa6inposition9737:illegalmultibytesequence一、问题复现File"D:\\Python\\Python3732\\lib\\sitepackages\
Stella981 Stella981
1年前
Python Challenge Level 18
初学Python,挑战一下流行的PythonChallenge,很不幸,卡在了18关~~被字符字节码之间的转换搞得焦头烂额,不过终于搞定了还是很happy的~~~主要的问题就是16进制形式的字符如何转成字节码(注意:不是encoding)如:\'89','50','4e','47','0d','0a','1a','0a','00
Wesley13 Wesley13
1年前
MySQL中utf8和utf8mb4的区别
一、UTF8是什么utf8”只是“utf8mb3”的一个别名,可以支持13字节表示的unicode字符。而MySQL在5.5.3版本之后增加了一个utf8mb4的编码,mb4就是mostbytes4的意思,用来兼容四字节的unicode。其实,utf8mb4是utf8的超集,理论上原来使用“utf
Stella981 Stella981
1年前
ELK学习笔记之配置logstash消费kafka多个topic并分别生成索引
0x00 filebeat配置多个topicfilebeat.prospectors:input_type:logencoding:GB2312fields_under_root:truefields:添加字段
Wesley13 Wesley13
1年前
PHP 截取字符串
1.截取GB2312中文字符串<?php//截取中文字符串functionmysubstr($str,$start,$len){$tmpstr"";$strlen$start$len;for($i0;
Stella981 Stella981
1年前
PHP检测当前字符编码并转码
一、检测当前字符串编码并将编码改为utf81获取当前字符串的编码$encodemb\_detect\_encoding($str,array("ASCII",'UTF8',"GB2312","GBK",'BIG5')); 2将字符编码改为utf8$str\_encodemb\_convert\_encoding($st
Wesley13 Wesley13
1年前
VC++中关于TCHAR,WCHAR,LPSTR,LPWSTR,LPCTSTR的解释
一般来说,一个字符(character)占用1字节或是2字节,我们说1字节的字符是ANSI,他可以用来表示英语字母,而2字节的我们称之为Unicode,可以表示世界上所有的语言。。VC使用char和wchar\_t的内置数据类型来分别作为表示ANSI和Unicode字符。如果你想让你的C/C程序是字符集无关的,该怎么做呢?如果你用通
Stella981 Stella981
1年前
Python爬虫初学
学习爬虫中,从最近自己写的爬虫小程序中抓截一点代码。加深下记忆。1.因为我已经安装了Python3,所以使用了urllib3库。2.要根据对应网页的数据格式进行解码,有的是utf8,有的是GB2312,当然可能还有其它。否则会报错。import urllib3import time因为我使用了Python3,所以使用urlli
风花雪月
风花雪月
Lv1
道理只会告诉你对错但未必能给你幸福.
37
文章
2
粉丝
3
获赞