pandas创始人手把手教你利用Python进行数据分析(思维导图)

Karen110
• 阅读 1825

导读: Python是目前数据科学领域的王者语言,众多科学家、工程师、分析师都使用它来完成数据相关的工作。由于Python具有简单易学、语法灵活的特点,很多需要处理数据的人士想要学习,主要有两大类:

  • 财经类、统计类背景人员,他们的日常工作有大量数据需要处理、分析,但对于学习使用计算机领域的编程语言Python又感到无从下手。

  • 一些想要学习Python的计算机人员,他们工作较忙,没有太多时间通过互联网去系统学习Python数据技术

针对这两类人员的需求,近期出版上市的《利用Python进行数据分析》第2版是很好的选择。下面我们结合本书内容,大致介绍下如何利用Python进行数据分析。

pandas创始人手把手教你利用Python进行数据分析(思维导图)

01 Python数据分析流程及学习路径

数据分析的流程概括起来主要是:读写处理计算分析建模可视化四个部分。在不同的步骤中会用到不同的Python工具。每一步的主题也包含众多内容。

pandas创始人手把手教你利用Python进行数据分析(思维导图)

根据每个部分需要用到的工具,Python数据分析的学习路径如下:

pandas创始人手把手教你利用Python进行数据分析(思维导图)

02 利用Python读写数据

Python读写数据,主要包括以下内容:

pandas创始人手把手教你利用Python进行数据分析(思维导图)

我们以一小段代码来看:

pandas创始人手把手教你利用Python进行数据分析(思维导图)

可见,仅需简短的两三行代码即可实现Python读入EXCEL文件。

03 利用Python处理和计算数据

pandas创始人手把手教你利用Python进行数据分析(思维导图)

在第一步和第二步,我们主要使用的是Python的工具库NumPy和pandas。其中,NumPy主要用于矢量化的科学计算,pandas主要用于表型数据处理。

pandas创始人手把手教你利用Python进行数据分析(思维导图)

▲NumPy

pandas创始人手把手教你利用Python进行数据分析(思维导图)

▲pandas

04 利用Python分析建模

pandas创始人手把手教你利用Python进行数据分析(思维导图)

在分析和建模方面,本书主要介绍了Statsmdels和Scikit-learn两个库。

.Statsmodels允许用户浏览数据,估计统计模型和执行统计测试。可以为不同类型的数据和每个估算器提供广泛的描述性统计,统计测试,绘图函数和结果统计列表。

pandas创始人手把手教你利用Python进行数据分析(思维导图)

▲.Statsmodels

Scikit-leran则是著名的机器学习库,可以迅速使用各类机器学习算法。

pandas创始人手把手教你利用Python进行数据分析(思维导图)

▲Scikit-leran

05 利用Python数据可视化

pandas创始人手把手教你利用Python进行数据分析(思维导图)

数据可视化是数据工作中的一项重要内容,它可以辅助分析也可以展示结果。本书主要介绍了Python众多可视化库中最为主流的Matplotlib:

pandas创始人手把手教你利用Python进行数据分析(思维导图)

06 总结:为什么要选这本书

《利用Python进行数据分析》第2版原作者是美国的数据科学家Wes McKinney,他毕业于麻省理工学院,是大名鼎鼎的Python数据技术类库pandas的创始人,在多家投资银行从事过数据科学类的工作。本书第一版由Wes McKinney写于2010年,经过7年的技术发展,第一版中的部分技术已不再适用,因此他于2017年发表了本书的第二版,对书中的大量技术、代码、示例进行了更新。由于本书大受好评,国内旋即引进。

关于作者:徐敬一,是《利用Python进行数据分析》第2版的译者,中国工商银行的数据分析师,他在工作中大量使用各类Python数据技术,对于Python的数学科学技术栈十分了解,同时英语水平良好,使本书的翻译质量得以保证。

**-----**------**-----**---**** 送书 **-----**--------**-----**-****

内容简介

1、《利用Python进行数据分析》内容简介推荐语:

适合刚学Python的数据分析师或刚学数据科学以及科学计算的Python编程者。阅读本书可以获得一份关于在Python下操作、处理、清洗、规整数据集的完整说明。

活动规则

参与方式:在本公众号后台回复 “送书”关键字,记得是“送书”二字哈,即可参与本次的送书活动,一共送3本书。

公布时间:2021年1月27号(周三)晚上20点

领取事宜:请小伙伴添加小助手微信: pdcfighting,或者扫码添加好友。添加小助手的每一个人都可以领取一份Python学习资料,更重要的是方便联系。

pandas创始人手把手教你利用Python进行数据分析(思维导图)

注意事项:一定要留意微信消息,如果你是幸运儿就尽快在小程序中填写收货地址、书籍信息。一天之内没有填写收货信息,送书名额就转给其他人了噢,欢迎参与~

**-----**------**-----**---**** End **-----**--------**-----**-****

往期精彩文章推荐:

pandas创始人手把手教你利用Python进行数据分析(思维导图)

欢迎各位大佬点击链接加入群聊【helloworld开发者社区】:https://jq.qq.com/?_wv=1027&k=mBlk6nzX进群交流IT技术热点。

本文转自 https://mp.weixin.qq.com/s/jNOWOiMH1c8khy4E-RCmtg,如有侵权,请联系删除。

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Jacquelyn38 Jacquelyn38
2年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Stella981 Stella981
2年前
Python3:sqlalchemy对mysql数据库操作,非sql语句
Python3:sqlalchemy对mysql数据库操作,非sql语句python3authorlizmdatetime2018020110:00:00coding:utf8'''
Stella981 Stella981
2年前
Python之time模块的时间戳、时间字符串格式化与转换
Python处理时间和时间戳的内置模块就有time,和datetime两个,本文先说time模块。关于时间戳的几个概念时间戳,根据1970年1月1日00:00:00开始按秒计算的偏移量。时间元组(struct_time),包含9个元素。 time.struct_time(tm_y
Wesley13 Wesley13
2年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
2年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
2年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
2年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
2个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这