Karen110 Karen110
2年前
总结了pandas提取数据的15种方法,统统只需1行代码,真香!
pandas是python数据分析必备工具,它有强大的数据清洗能力,往往能用非常少的代码实现较复杂的数据处理今天,鸟哥总结了pandas筛选数据的15个常用技巧,主要包括5个知识点:1.比较运算:、<、、、<、!2.范围运算:between(left,right)3.字符筛选:str.contains(pattern或字符串,naFalse)4.逻辑运算:&
Aidan075 Aidan075
3年前
数据可视化 | 数据可视化的基本流程总结
↑关注星标  有趣的不像个技术号每晚九点,我们准时相约  我们要的不是数据,而是数据告诉我们的事实。大多数人面临这样一个挑战:我们认识到数据可视化的必要性,但缺乏数据可视化方面的专业技能。部分原因可以归结于,数据可视化只是数据分析过程中的一个环节,数据分析师可能将精力花在获取数据、清洗整理数据、分析数据、建立模型,但在最终的展示沟通
Aidan075 Aidan075
3年前
1年前的小五都用 Python 来做什么?
↑点击上方“凹凸数据” 关注星标 每天更新,干货不断  (多图预警)注:这是小五一年前在知乎的回答,当时还只有凹凸数读一个公众号,所以很多图片都会带有数读或者知乎的水印。作为一个菜鸟数据分析师,只会sqlpython业余时间写写文章:用python爬取数据→数据清洗→数据分析→数据可视化词云镇楼20190730回来看,前面
Stella981 Stella981
2年前
Elasticsearch全文检索实战小结
一、项目概述这是一个被我称之为“没有枪、没有炮,硬着头皮自己造”的项目。项目是和其它公司合作的三个核心模块开发。 使用ES的目的是: 1)、采集数据、网站数据清洗后存入ES; 2)、对外提供精确检索、通配符检索、模糊检索、分词检索、全文检索接口等二次封装接口。二、项目架构!这里写图片描述(http
可莉 可莉
2年前
060 Python必备库
\TOC\一、概述1.1从数据处理到人工智能数据表示数据清洗数据统计数据可视化数据挖掘人工智能数据表示:采用合适方式用程序表达数据数据清理:数据归一化、数据转换、异常值处理数据统计:数据的概要理解,数量、分布、中位数等
Stella981 Stella981
2年前
060 Python必备库
\TOC\一、概述1.1从数据处理到人工智能数据表示数据清洗数据统计数据可视化数据挖掘人工智能数据表示:采用合适方式用程序表达数据数据清理:数据归一化、数据转换、异常值处理数据统计:数据的概要理解,数量、分布、中位数等
Python进阶者 Python进阶者
1年前
盘点一个Pandas数据清洗题目
大家好,我是皮皮。一、前言前几天在Python白银交流群有个叫【冻豺】的粉丝问了一道Python清洗数据的问题,这里拿出来给大家分享下,一起学习下。如何才能把pandasserise里乱七八糟的字符清理干净呢?二、解决过程【dcpeng】解答这里给出了一个示例的代码,使用了apply和lambda和正则表达式,一气呵成,只需要稍微修改下,匹配自己的数
高耸入云 高耸入云
4个月前
成为AI大模型工程师/产品经理,成就丰盛人生
500多名学员正在参加近屿智能OJAC举办的第五期AIGC星辰大海:大模型工程师和产品专家深度训练营。AIGC星辰大海:大模型工程师和产品专家深度训练营秉持“实战导向,项目驱动”的教学理念,从预训练、数据清洗、数据标注、微调大模型到增量预训练以及开发软硬件
京东云开发者 京东云开发者
2个月前
数据质量和数据治理的关系 | 京东云技术团队
很多不太了解的人会认为:数据治理就是干数据清洗的。近两年,在我们公司,数据治理团队在数据降本方面做的比较多,效果还不错,我们很多人可能以为:数据治理就是做数据清理的。在京东科技集团数据治理工作组第一次全体会议上,我就讲过数据治理和数据清洗之间的关系:数据清
臧霸 臧霸
1星期前
AI大模型系统实战 | 更新完
AI大模型系统实战|更新完download:itzx666.com/8556/更新完毕后,你可以考虑以下步骤来实战应用AI大模型系统:1.数据准备与清洗:收集并清洗你的数据,确保数据质量和完整性。这可能涉及数据清洗、标注、去噪等过程。2.模型选择与训练:根