1年前的小五都用 Python 来做什么?

Aidan075 等级 613 0 0

↑ 点击上方 “凹凸数据” 关注 + 星标 ~

每天更新,干货不断 1年前的小五都用 Python 来做什么?

1年前的小五都用 Python 来做什么?

(多图预警)

注:这是小五一年前在知乎的回答,当时还只有凹凸数读一个公众号,所以很多图片都会带有数读或者知乎的水印。


作为一个菜鸟数据分析师,只会sql+python

业余时间写写文章:用python爬取数据→数据清洗→数据分析→数据可视化

1年前的小五都用 Python 来做什么?

词云镇楼

20190730回来看,前面的文章好水哈哈,大家耐心往下看吧

举几个最近用python做的比较有趣的小项目:

分析30万条微博评论,看毕业生与翟天临的爱恨情仇

2019年5月27日凌晨,翟天临又上了热搜→被毕业生骂上的热搜。为了探索这个有趣的现象和背后的问题,我爬取了翟天临2月道歉微博下的30万余条评论。

1年前的小五都用 Python 来做什么?

1年前的小五都用 Python 来做什么?

在这30万条评论中,有20多万条集中在3月2日之前,在此阶段,粉丝积极控评与吃瓜群众的嘲讽占大多数。

1年前的小五都用 Python 来做什么?

3月2日到5月26日,随着查重标准的发布,开题、初稿等任务的进行,开始陆陆续续有学生来到他的微博下发泄怒火。这时的内容,主要分为以下几种:

1年前的小五都用 Python 来做什么?

上述第二阶段中的评论用户,既不是来吃瓜的,也不是看到热搜来凑热闹的,他们是真正被论文困扰而来宣泄怒火的。因此我们爬取了他们在个人主页中填写的学校信息,发现以下学校的学生吐槽频次较高,这些学校很有可能调整了查重率或者提高了其他通过标准。

1年前的小五都用 Python 来做什么?

评论“睡了吗”的同学中,基本集中在半夜11点到凌晨3点的时间段,这时的同学经历了漫长的改重洗礼,用残存的力气也要去问候翟天临一句。而到了3点以后,怕是连问一句“睡了吗”的心情都没有了(因为他肯定睡了)

1年前的小五都用 Python 来做什么?

以上是截取的文章部分,原文链接请戳《分析30万条微博评论,看毕业生与翟天临的爱恨情仇

拆开药店所有的感冒药,用数据解读药品说明书

这篇文章的起因是我感冒了,翻出了家里仅剩半盒的感冒药,但说明书早已不翼而飞。机智的我在网上药店里搜到了这款药品,了解了它的用量和禁忌等。依然心系工作的我正好顺势爬取了康之家网上药店在售的654种感冒药的说明书,决定用数据解读一下!

1年前的小五都用 Python 来做什么?

在感冒药界,要问哪家品牌的种类最多,同仁堂是当之无愧的王者,而且这家店是标准中国老字号,只生产中药类感冒药。

1年前的小五都用 Python 来做什么?

将中药与西药的成份分别进行了汇总,并且绘制成词云。

1年前的小五都用 Python 来做什么?

1年前的小五都用 Python 来做什么?

工作了之后越发觉得生个病真是太贵了,不去医院光吃药就要花掉不少毛爷爷,于是看过了说明书的有趣数据,我们自然而然把目光转向了……价格。我们对比了西药和中药,发现西药的价格集中在20元左右,而中药的价格要更低一些,集中在10元左右。

1年前的小五都用 Python 来做什么?

以上是截取的文章部分,原文链接请戳:《拆开药店所有的感冒药,用数据解读药品说明书》

素人与欧阳娜娜的vlog之间,相隔的不只是明星光环

这篇主要是为了研究vlog究竟是“真风口”还是“伪风口”,我们爬取了国内最大原创 Vlog 平台“Vue Vlog”app上的30万条视频及其作者的信息。

1年前的小五都用 Python 来做什么?

从整体上看,在Vue Vlog上发过视频的用户中,90后,即20—30岁左右的年轻人,占据了vlogger的半壁江山。而在各个年龄段,女性都明显多于男性。相比于男性而言,女性似乎更乐于分享自己的生活。有趣的是,水瓶座在所有vlogger的星座中占比最高,是其他星座的2倍左右。

1年前的小五都用 Python 来做什么?

这里要注明一下,右侧单纯是星座的排行,本意是突出显示一下第一名水瓶座,结果用的配色是左侧男性的颜色,很容易让大家误解是男性且水瓶座排名第一

从时长上看,普通用户的大部分视频都在1分钟以内,而大V集中在3-8分钟。

1年前的小五都用 Python 来做什么?

我们分析了vlog发布时间段对平均播放量的影响,发现在一周当中,周五的平均播放量明显高于其他时间段。

1年前的小五都用 Python 来做什么?

平均播放量最高的时间点则有几个小高峰。早上起床的8、9点,中午和晚上下班放学的12点和5点,以及晚上睡觉前的9点左右,都是发视频的好时机。而凌晨2-4点由于发视频数量较少,平均播放量也整体较高。

从内容类型来看,普通vlogger作品中播放量比较高的多数具备一些专业技能,如滑雪和潜水等极限运动,以及摄影、弹唱等个人才艺。

1年前的小五都用 Python 来做什么?

以上是截取的文章部分,原文链接请戳:《素人与欧阳娜娜的vlog之间,相隔的不只是明星光环

第一批看《复联4》的网友,都在评论区说了什么?

原文链接:《第一批看《复联4》的网友,都在评论区说了什么?

爬取了微博、猫眼、知乎、豆瓣的评论或者回答做成了词云

1年前的小五都用 Python 来做什么?

五一去长沙,到了吃点啥?

在大众点评的筛选机制中,只能按单项指标排序,而智能排序又会把投放广告的或者新店优先排在前面。于是,我们爬取了大众点评上橘子洲头附近4312家长沙美食的基础信息。我们设定的筛选目标湘菜馆的要求是:评论人数超过500,各项评分均在9分以上,人均消费不超过100。

1年前的小五都用 Python 来做什么?

我们又用同样的方法,筛选出性价比最高的烧烤、火锅、小龙虾、臭豆腐、粉面馆、饮品……

1年前的小五都用 Python 来做什么?

1年前的小五都用 Python 来做什么?

以上是截取的文章部分,原文链接请戳:《五一去长沙,到了吃点啥?

十张图告诉你:互联网运营狗的生存现状

我们爬取了实习僧和拉勾网上共12715条关于运营的招聘信息,来更好地了解运营狗生存(主要是工资)现状。

在城市的选择上,我们发现,北京对于运营实习生的需求量最大,上海广州深圳杭州依次递减。要来运营岗实习,一线城市对你来说,将是机会最多的选择。

1年前的小五都用 Python 来做什么?

但一线城市的三餐、交通与房租对于实习生来说,无疑是很大的压力。因此我们分析了不同地域运营实习生的日均薪资水平,看看哪些城市的薪水能让你吃到更好吃的土。

1年前的小五都用 Python 来做什么?

其中日均实习工资在100-150范围的岗位,在大部分城市都超过了50%的占比,这也是运营实习生最可能拿到的工资。而在北上深三地,实习生拿到“高薪”(日工资超过150元)的可能性明显高于其他地区。相对这些城市来讲,广州运营实习工资低于100的岗位占比较高,在广州实习的同学将有更多进入hard生存模式。


20190730更新,没想到大家这么支持,那就再更新几个(每个简单只放一张图):

蔡徐坤1亿转发量幕后推手被封,能否动摇饭圈文化?

1年前的小五都用 Python 来做什么?

原文链接请戳:《蔡徐坤1亿转发量幕后推手被封,能否动摇饭圈文化?

290种零食大统计,谁能唤起80、90后的童年回忆?

1年前的小五都用 Python 来做什么?

原文链接请戳:《290种零食大统计,谁能唤起80、90后的童年回忆?》

宫崎骏:纵有疾风起,人生不言弃。

1年前的小五都用 Python 来做什么?

原文链接请戳:《宫崎骏:纵有疾风起,人生不言弃。

中国撸串指北:13万家烧烤店的吃货最爱

1年前的小五都用 Python 来做什么?

原文链接请戳:《中国撸串指北:13万家烧烤店的吃货最爱

这里面都是小五一年前做的有趣的事,大家更喜欢哪一个呢?

欢迎留言、点赞、分享~

1年前的小五都用 Python 来做什么?

1年前的小五都用 Python 来做什么?

1年前的小五都用 Python 来做什么?

本文转转自微信公众号凹凸数据原创https://mp.weixin.qq.com/s/q1fn6GHMazxdOB3la9HT9w,可扫描二维码进行关注: 1年前的小五都用 Python 来做什么? 如有侵权,请联系删除。

收藏
评论区

相关推荐

被“词云”包围的冰冰会更好看吗?安排
(https://imghelloworld.osscnbeijing.aliyuncs.com/b299933deefc692934e8cc6141ab3894.png) 大家好,我是小五🐶 昨天「凹凸数据」发了一篇张同学投稿的文章《用Python爬取王冰冰vlog弹幕并制作词云(https://mp.weixin.qq.com/
1年前的小五都用 Python 来做什么?
↑ 点击上方 “凹凸数据” 关注 + 星标  每天更新,干货不断   (多图预警) 注:这是小五一年前在知乎的回答,当时还只有凹凸数读一个公众号,所以很多图片都会带有数读或者知乎的水印。 作为一个菜鸟数据分析师,只会sql+python业余时间写写文章:用python爬取数据→数据清洗→数据分析→数据可视化词云镇楼20190730回来看,前面
pip 最新版 发布(Python包安装和管理工具)
↑ 点击上方 “凹凸数据” 关注 + 星标  每天更新,大概率是晚9点   最新版的pip 20.1 已发布,大家可以通过下面的命令进行升级:python m pip install upgrade pip ‍ ‍更新主要更新内容: 在构建本地目录时,通过更改行为来执行就地构建(inplace builds),而不是复制到临时目录,可以显著加速。
为啥要学Python?
为啥要学Python?如果我跟你说你现在用一天拉出来的财务统计表,学了Python之后能用1个小时就搞定,你学不学?如果你花了8个小时扒的竞品投放数据,学了Python之后能用30min搞定,你学不学?你总羡慕你的同事能6点下班,陪女朋友蹦迪夜生活丰富,你却在满脸油头的爆肝加班,学了Python之后,你也能这样,你学不学?如果我跟你说,学会了Python能增
1、Python 日期时间格式化输出
今天帮朋友写自动化脚本,又需要用格式化日期,又忘记怎么写了,还是写到自己博客里面,方便日后需要的时候看一眼吧。So,临时加一篇 Python 的文章。 1、Python的time模块 import time print(time.time()) #输出的是时间戳 print(time.localtime(time.ti
MAC中怎么安装python
转自:https://blog.csdn.net/hou\_manager/article/details/79555809 一、Python 介绍 Python介绍 Python3在2008年12月3日正式发布, 但是有很多library还是使用Python2.7,所以需要在Mac里面同时装这两个版本,并且和系统所使用的Python区分开来呢?今天要
OSChina 周日乱弹 ——儿子在别人手上,怎么办!
@[翟志军](http://my.oschina.net/zjzhai) : 家乡的茶园开满花,妈妈的心肝在天涯 想妈妈, 这歌曲可以有。 家 - 南拳妈妈   手机党少年们想听歌,请使劲儿戳([这里](https://www.oschina.net/action/GoToLink?url=http%3A%2F%2Fwww.xiami.com%2F
Python web开发从入门到放弃
点击上方“**Python爬虫与数据挖掘**”,进行关注 回复“**书籍**”即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 无为之用方为大用。 ![](https://oscimg.oschina.net/oscnet/f64430c27950bcccce040bb032ea65e73a5.jpg) 越来越多的同学知道我在做
Python 使用VS Code进行调试
VS Code是一款非常好用的编辑器,现在我基本上所有的开发任务都在VS Code上完成。它的代码调试工具其实也非常强大,但是许多人都不知道该怎么用,今天就来学习怎么用它调试Python代码吧。 **1.准备** -------- 既然是用VS Code调试Python代码,那当然你得先安装好Python啦,如果你还没有安装,可以看这篇文章:超详细Pyt
Python 爬虫:把廖雪峰的教程转换成 PDF 电子书
写爬虫似乎没有比用 Python 更合适了,Python 社区提供的爬虫工具多得让你眼花缭乱,各种拿来就可以直接用的 library 分分钟就可以写出一个爬虫出来,今天就琢磨着写一个爬虫,将廖雪峰的 Python 教程 爬下来做成 PDF 电子书方便大家离线阅读。 开始写爬虫前,我们先来分析一下该网站[1](https://www.oschina.net/
Python中Requests库的高级用法
前面讲了Python的urllib库的使用和方法,Python网络数据采集Urllib库的基本使用 ,Python的urllib高级用法 。 今天我们来学习下Python中Requests库的用法。([官方手册](https://www.oschina.net/action/GoToLink?url=http%3A%2F%2Fdocs.python-req
Python办公自动化(十九)|批量提取Excel数据
↑ 关注 + 星标 ,每天学Python新技能 后台回复【**大礼包**】送你Python自学大礼 ### ![](https://oscimg.oschina.net/oscnet/b775f705-7001-4a4c-8821-3be5d353f1cc.png) 今天我们来讲解一个比较简单的案例,使用`openpyxl`从Excel中
Python如何处理Excel表格?良心推荐!
![Python如何处理Excel表格?良心推荐!](https://oscimg.oschina.net/oscnet/4896a80e319ef00486232923a6825f6aeab.jpg) 写在前面 ==== Python常见的数据文件处理有5种,今天我们来讲讲其中的Excel如何处理! Excel是大家工作当中使用频率比较高的一款办公软
Python语言程序设计基础(第2版)课后习题答案 嵩天、礼欣、黄天羽版 高等教育出版社 试题和答案和解析
**Python语言程序设计基础(第2版)课后习题答案  嵩天、礼欣、黄天羽版 高等教育出版社 试题和答案和解析 复习提纲** **![](https://oscimg.oschina.net/oscnet/dd95fc8fbb6927d4e71067806fc01912bcd.jpg)** **Python语言程序设计基础(第2版)** **完整版答
Python(32bit)运行报错:MemoryError
由于最近使用的是32位系统,安装和运行Python各种问题 有在网上搜这方面的问题,大多数回答是:**python 32bit 最大只能使用 2G 内存,超过 2G 报错MemoryError,解决的办法是使用 64bit python。** 而我面临的情况是操作系统无法更换,只能自己去摸索解决办法了 首先我查看了数据量是不小但是运行应该是没有问题的