数分工具鄙视链:Python成老大,Excel小弟都称不上?

智数逸影客
• 阅读 175

佛说,一切众生相皆是无相。数据分析做到极致,也可以“无相无生”。

数分工具鄙视链:Python成老大,Excel小弟都称不上?

在说今天的话题之前,我想先抛出一个结论:

“做数据分析,不要建立一种以掌握的软件来给自己分级的心态,但是一定要用工具避免误入职业发展的歧途!”

为什么今天要谈关于数据分析工具分级的问题呢?

其实这涉及到职场中一个非常常见的现象——工具鄙视链

  • 会python编程语言的,瞧不起用自助BI工具做数据分析的;
  • 会用Tableau、FineBI这种分析工具的,瞧不起会用SPSS、SQL这种数据工具的;
  • 会用SPSS、SQL的,瞧不起用PPT做数据汇报的;
  • 会用PPT做数据汇报的,瞧不起只会用Excel做数据统计与整理的;

数分工具鄙视链:Python成老大,Excel小弟都称不上?

逃不开的鄙视链

不光是数据分析行业,在程序员、产品经理等行业中都存在这样的鄙视链

也有不少人和公司,遵从着这样的鄙视链现象,通过这样的鄙视链进行岗位的分级,或者作为选人招聘的门槛标准

而这个鄙视链似乎是与这个岗位生死同戚、共生共存、难以分离的:

比如我,在前几年我还刚接触数据分析的时候,只学会用Excel做数据处理,所有的数据清洗、数据加工和图表可视化工作都是用Excel完成的

但是看着网上很多人都在学Python编程,当时还有一种“python才是数据分析标配”的言论,我也成为了跟风的一份子

数分工具鄙视链:Python成老大,Excel小弟都称不上?

当时带我的老大就告诉我:

网上说学python才能做数据分析的,纯粹就是放屁,python做数据分析确实比Excel要专业一些,但是真正的核心,是要是什么数据场景和什么人在用。

我用Excel做的数据清洗绝对能完爆这些工具,但是我想做一些高级可视化,也会用python去做,谁规定数据分析师只能用一个软件了?

说到底还是出于对数据分析岗位的自卑,数据分析才出现几年啊,谁都觉得用Excel做数据分析太low逼了,一点体现不出我们的专业性,不学一门编程语言,其他部门的人谁瞧得起我们?”

数分工具鄙视链:Python成老大,Excel小弟都称不上?

对于我老大的话,我深以为然,正是出于对于数据分析作岗位的错误认知,才会造成那么多人对于数据分析工具的误解

其实这么多年,excel、Tableau、FineBI、PowerBI、SPSS、Python......我几乎每种工具和软件都用过,并没有觉得哪一种是最万能的

工具从来只是工具,是用来辅助我们进行数据分析的,最核心的关键还是在于人,也就是你是否真的具有数据分析思维和能力

像我之前老大的能力,用Excel照样牛逼;要是没有能力,学一万种语言都没用!

所以很多刚入门数据分析的朋友,一上来就买很多Python,R语言,VBA的书籍和资料,安装了各个语言的环境

但其实数据分析师的日常工作,最多就是用到SQL取数以及Excel数据透视图、BI分析工具中拖拉拽图表

数分工具鄙视链:Python成老大,Excel小弟都称不上?

所以,会用工具不是能力,懂得数据思维,才是数据分析师存在的意义

工具是辅助

那么回到我们今天的话题,数据分析当中有着不同的数据场景,会用到非常多的工具,那么应该如何选择,下面简单举几个例子

1、excel

别以为EXCEL只会处理表格,你可以把它当成数据库,也可以把它当成IDE,甚至可以把它当成数据可视化工具来使用

它可以创建专业的数据透视表和基本的统计图表,但由于默认设置了颜色、线条和风格,使其难以创建用于看上去“高大上”视觉效果

尽管如此,我仍然推荐你使用Excel

2、BI工具

近几年冒出来的BI之秀,如TB、qlk都强调可视化,一改传统BI工具SAP BO、IBM家的cognos(不过近几年貌似都在研发云BI)

这里不谈开源,还没见到能成熟应用的BI,成熟的BI工具如FineBI(国内)和 Tableau(国外),都很推荐

数分工具鄙视链:Python成老大,Excel小弟都称不上?

3、python

学过Python数据分析的朋友都知道,在可视化的工具中,有很多优秀的三方库,比如matplotlib,seaborn,plotly,Boken,pyecharts等等,这些可视化库都有自己的特点,在实际应用中也广为大家使用

数分工具鄙视链:Python成老大,Excel小弟都称不上?

4、SPSS

SPSS是统计分析入门软件,如果你想快速入门而又不想学习编程,我推荐使用SPSS

学习SPSS的重点并不在于软件本身,而是相关的统计学知识,这也是在前面建议大家铺垫的,也就是你要学会怎样去分析“输入数据后,软件给你呈现的结果”

推荐大家一本书:《如虎添翼 数据处理的SPSS/SAS EG实现》,徐筱刚老师写的,十分适合SPSS新手入门

最后说点啥

其实今天谈的这个话题,也是其他行业里常见的现象之一,既然产生了这种乱象,说明一定有其产生的原因与逻辑,我们不必太过敏感

但是,对于我们数据分析师自身而言,真正做分析时候,你会发现市面上有太多的分析工具,需要掌握的实在是太多了

其实不必纠结于此,依据个人能力,配合当前的数据分析环境,适用的工具自然会被选出,最后记住一句话:工具是人用的,重点在于人,而不在于工具!

点赞
收藏
评论区
推荐文章
blmius blmius
4年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
Wesley13 Wesley13
4年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Stella981 Stella981
4年前
Python3:sqlalchemy对mysql数据库操作,非sql语句
Python3:sqlalchemy对mysql数据库操作,非sql语句python3authorlizmdatetime2018020110:00:00coding:utf8'''
Stella981 Stella981
4年前
SpringBoot整合Redis乱码原因及解决方案
问题描述:springboot使用springdataredis存储数据时乱码rediskey/value出现\\xAC\\xED\\x00\\x05t\\x00\\x05问题分析:查看RedisTemplate类!(https://oscimg.oschina.net/oscnet/0a85565fa
Wesley13 Wesley13
4年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
4年前
NEO从源码分析看UTXO交易
_0x00前言_社区大佬:“交易是操作区块链的唯一方式。”_0x01交易类型_在NEO中,几乎除了共识之外的所有的对区块链的操作都是一种“交易”,甚至在“交易”面前,合约都只是一个小弟。交易类型的定义在Core中的TransactionType中:源码位置:neo/Core/TransactionType
Easter79 Easter79
4年前
SpringBoot整合Redis乱码原因及解决方案
问题描述:springboot使用springdataredis存储数据时乱码rediskey/value出现\\xAC\\xED\\x00\\x05t\\x00\\x05问题分析:查看RedisTemplate类!(https://oscimg.oschina.net/oscnet/0a85565fa
Python进阶者 Python进阶者
2年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这