报错'gb2312' codec can't decode byte 0x9e in position 4100: illegal multibyte sequence,“gb2312”编解码器无法解码位置4100中的字节0x9e:非法的多字节序列

风花雪月
• 阅读 1706

“gb2312”编解码器无法解码位置4100中的字节0x9e:非法的多字节序列。

处理方式: with open(path, encoding="utf8", errors='ignore') as f:

使用errors='ignore'去掉(忽略)字符并返回不带字符的字符串。

点赞
收藏
评论区
推荐文章
浅梦一笑 浅梦一笑
1个月前
初学 Python 需要安装哪些软件?超级实用,小白必看!
编程这个东西是真的奇妙。对于懂得的人来说,会觉得这个工具是多么的好用、有趣,而对于小白来说,就如同大山一样。其实这个都可以理解,大家都是这样过来的。那么接下来就说一下python相关的东西吧,并说一下我对编程的理解。本人也是小白一名,如有不对的地方,还请各位大神指出01名词解释:如果在编程方面接触的比较少,那么对于软件这一块,有几个名词一定要了解,比如开发环
CuterCorley CuterCorley
1年前
Python Django开发 异常及解决办法(三)
1.Django2.2报错'gbk' codec can't decode byte 0xa6 in position 9737在使用Django时,可能会报错如下:pythonFile "C:\Users\LENOVO\.virtualenvs\Django_FrameworkwC9HNSeq\lib\sitepackages\django
Stella981 Stella981
1年前
Django2.2 报错:UnicodeDecodeError 解决方法
> Django2.2报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xa6 in position 9737: illegal multibyte sequence 一、问题复现 ------ File "D:\\Python\\Python37-32\\lib\\site-packages\
Stella981 Stella981
1年前
Python Challenge Level 18
初学Python,挑战一下流行的Python Challenge,很不幸,卡在了18关~~被字符字节码之间的转换搞得焦头烂额,不过终于搞定了还是很happy的~~~ 主要的问题就是16进制形式的字符如何转成字节码 (注意:不是encoding) 如:\['89', '50', '4e', '47', '0d', '0a', '1a', '0a', '00
Wesley13 Wesley13
1年前
MySQL中utf8和utf8mb4的区别
一 、UTF8是什么 ========== **utf8**”只是“**utf8mb3**”的一个别名,可以支持1-3字节表示的unicode字符。 而MySQL在5.5.3版本之后增加了一个**utf8mb4**的编码,mb4就是most bytes 4的意思,用来兼容四字节的unicode。其实,utf8mb4是utf8的超集,理论上原来使用“utf
Stella981 Stella981
1年前
ELK学习笔记之配置logstash消费kafka多个topic并分别生成索引
0x00 filebeat配置多个topic ---------------------- filebeat.prospectors: - input_type: log encoding: GB2312 # fields_under_root: true fields: ##添加字段
Wesley13 Wesley13
1年前
PHP 截取字符串
1. 截取GB2312中文字符串 < ?php //截取中文字符串 function mysubstr($str, $start, $len) { $tmpstr = ""; $strlen = $start + $len; for($i = 0;
Stella981 Stella981
1年前
PHP检测当前字符编码并转码
一、检测当前字符串编码并将编码改为utf-8 1 获取当前字符串的编码 $encode = mb\_detect\_encoding($str, array("ASCII",'UTF-8',"GB2312","GBK",'BIG5'));  2 将字符编码改为utf-8 $str\_encode = mb\_convert\_encoding($st
Wesley13 Wesley13
1年前
VC++中关于TCHAR,WCHAR,LPSTR,LPWSTR,LPCTSTR的解释
一般来说,一个字符(character)占用1字节或是2字节,我们说1字节的字符是ANSI,他可以用来表示英语字母,而2字节的我们称之为Unicode,可以表示世界上所有的语言。。 VC++使用char和wchar\_t的内置数据类型来分别作为表示ANSI和Unicode字符。 如果你想让你的C/C++程序是字符集无关的,该怎么做呢? 如果你用通
Stella981 Stella981
1年前
Python爬虫初学
学习爬虫中,从最近自己写的爬虫小程序中抓截一点代码。加深下记忆。 1.因为我已经安装了Python3,所以使用了urllib3库。 2.要根据对应网页的数据格式进行解码,有的是utf-8,有的是GB2312,当然可能还有其它。否则会报错。 import urllib3 import time #因为我使用了Python3,所以使用urlli
风花雪月
风花雪月
Lv1
道理只会告诉你对错但未必能给你幸福.
35
文章
2
粉丝
3
获赞