盘点一个Pandas数据清洗题目

Python进阶者
• 阅读 330

大家好,我是皮皮。

一、前言

前几天在Python白银交流群有个叫【冻豺】的粉丝问了一道Python清洗数据的问题,这里拿出来给大家分享下,一起学习下。

盘点一个Pandas数据清洗题目

如何才能把pandas serise里乱七八糟的字符清理干净呢?

二、解决过程

【dcpeng】解答

这里给出了一个示例的代码,使用了applylambda和正则表达式,一气呵成,只需要稍微修改下,匹配自己的数据就可以了。

df['主营业务']=df['主营业务'].astype('str').apply(lambda x: re.sub('[0-9+,,.。…、“”^_?::’‘''""()();;【】!!*?]+', '', x))

盘点一个Pandas数据清洗题目

不过这个是通用的,也会把数字干掉,如果想适配自己的数据,还需要稍微修改下。

盘点一个Pandas数据清洗题目

这样问题就完美解决了,另外的话,遇到特殊字符什么的,都可以优先使用re.sub或者replace()函数,事半功倍。

三、总结

大家好,我是皮皮。这篇文章主要分享了一个Pandas数据清洗题目,针对该问题给出了具体的解析和代码演示,一共两个方法,帮助粉丝顺利解决了问题。相信肯定还有其他方法的,欢迎大家积极尝试,如果有好方法,记得也分享给我噢,我帮助分享到群里,大家一起学习交流!

最后感谢【冻豺】提问,感谢【dcpeng】和【月神】大佬给出的具体解析和代码演示,感谢【冯诚】等人参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

点赞
收藏
评论区
推荐文章
Python进阶者 Python进阶者
1年前
分享一场Python正则表达式中的特殊序列问答交流
大家好,我是我是皮皮。一、前言前几天在Python最强王者交流群有个叫【杰】的粉丝问了一个关于Python正则表达式的问题,讨论十分火热,这里拿出来给大家分享下,一起学习。下图是原始题目:下面是给出的答案,乍看有点难懂,不过有正则狂魔【小王】大佬在,问题不大。二、解决过程这个这里给出【小王】大佬的解答,一起来看看吧,下面是他给的一个示例代码。import
Python进阶者 Python进阶者
1年前
编写一个闭包函数,要实现的功能是计数功能
大家好,我是皮皮。一、前言前几天在Python最强王者交流群有个叫【杰】的粉丝问了一个Python装饰器的问题,这里拿出来给大家分享下,一起学习下。二、解决过程这里【东哥】给出了解答,其实这个题目就是在考你装饰器的内容。代码如下:count0defwrapper(func):definner(args,kwargs):g
Python进阶者 Python进阶者
1年前
盘点Python正则表达式中的贪婪模式和非贪婪模式
大家好,我是我是皮皮。一、前言前几天在Python最强王者交流群有个叫【杰】的粉丝问了一个关于Python正则表达式的问题,其中涉及到Python正则表达式中的贪婪模式和非贪婪模式,讨论十分火热,这里拿出来给大家分享下,一起学习。二、解决过程这里分享【小王】大佬的解答,一起来看看吧,下面是他给的一个示例代码。importretxt"Thisis
Python进阶者 Python进阶者
1年前
虽然代码运行了,但其中的值为什么没有发生变化呀?
大家好,我是皮皮。一、前言前几天在Python白银交流群【王者级混子】问了一个Pandas处理的问题,这里拿出来给大家分享下。下面是粉丝自己写的代码:二、实现过程看上去是挺难的,又是数据,又是代码的,不过不慌,这里【论草莓如何成为冻干莓】指出了问题所在,原
Python进阶者 Python进阶者
1年前
盘点一个`07Apr2022`格式日期转换的基础题目
大家好,我是皮皮。一、前言前几天在Python星耀交流群有个叫【wangning】的粉丝问了一道Python日期转换的问题,这里拿出来给大家分享下,一起学习下。二、解决过程【瑜亮老师】解答这里给出了一个比较笨拙的方法,但是确实行之有效,使用了字符串处理字典处理的方法。defchange(d):monthdict"Apr":
Python进阶者 Python进阶者
1年前
把一个csv数据文件,第一行头文件(字段名)不变,按某列(第四列)降序排列,另行保存为csv 文件
大家好,我是皮皮。一、前言前几天在Python白银交流群有个叫【大侠】的粉丝问了一个关于Python自动化办公的问题,这里拿出来给大家分享下,一起学习。把一个csv数据文件,第一行头文件(字段名)不变,按某列(第四列)降序排列,另行保存为csv文件。二、解决过程【dcpeng】解答这里给出了一个思路,传统的常规思路,虽然很low,但是可行。【德善堂
Python进阶者 Python进阶者
1年前
如何读取保存一些list信息的txt,生成有一组名字有规律的list
大家好,我是皮皮。一、前言前几天在Python白银交流群有个叫【大侠】的粉丝问了一个Python列表处理的问题,这里拿出来给大家分享下,一起学习下。请教:如何读取保存一些list信息的txt,生成有一组名字有规律的list,如list1,list2,list3...二、解决过程【dcpeng】解答这里【dcpeng】给出了解答,纯粹往结果上靠。fina
Python进阶者 Python进阶者
1年前
盘点一道Pandas中分组聚合groupby()函数用法的基础题
大家好,我是皮皮。一、前言前几天在Python最强王者交流群有个叫【Chloé】的粉丝问了一个关于Pandas中groupby函数的问题,这里拿出来给大家分享下,一起学习。这个粉丝在法国留学,所以提问是英文的,当然了英文看上去也不难,有点二级英文基础,也看得懂,实在不行,在线翻译一下也问题不大了。二、解决过程这里给出【dcpeng】大佬和【月神】的解答。
Python进阶者 Python进阶者
11个月前
各位大神,我这代码,咋替换不成功?
大家好,我是皮皮。一、前言前几天在Python白银交流群【崔艳飞】问了一个Pandas处理的问题,这里拿出来给大家分享下。二、实现过程这里【瑜亮老师】给了一个解决思路,如下图所示:顺利地解决了粉丝的问题。虽然有警告,但是不影响操作。三、总结大家好,我是皮皮
Python进阶者 Python进阶者
2个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这