分享十张表的数据!大家一起玩!

Aidan075
• 阅读 1195

↑ 关注 + 置顶 ~ 有趣的不像个技术号

分享十张表的数据!大家一起玩!)分享十张表的数据!大家一起玩!

大家好,我是朱小五

经常看我文章的朋友都知道,我一般在文中会分享自己的爬虫脚本或思路。

最近有一些朋友留言表示对python不太熟悉,也不太会使用爬虫,但是对文中的数据很感兴趣。问小五能不能分享一下这些数据。

当然可以,

不过小五要先把涉及的用户信息去掉,再限制一下数据量,仅供大家学习交流,这样就没有法律风险啦~

一共十张表,数据量均限制在2000左右,数据格式为utf-8,供大家下载练习。

下载地址:公众号后台回复“1211”

分享十张表的数据!大家一起玩!

顺便帮大家匹配一下这些数据和涉及的文章。

北京历史天气.csv

《在北京看场雪为什么这么难?

王思聪微博热搜数据.csv

《王思聪究竟上了多少次热搜?

2019年微博明星势力榜周榜(1-22周).csv

《蔡徐坤1亿转发量幕后推手被封,能否动摇饭圈文化?

网易云音乐部分歌曲热评数据.csv

《44万条数据揭秘:如何成为网易云音乐评论区的网红段子手?

第一期节目评论数据_爱奇艺.csv

《数说:这只程序员组建的乐队为何能进HOT5?

爱情公寓5_b站弹幕.csv

《用Python爬取b站弹幕,看大家还会接受爱情公寓5吗?

拉勾招聘_数据分析师.csv

《用数据来分析数据分析师,我们发现……》

三国人物武力值.csv

《用python重温统计学基础:描述性统计分析》

qq音乐_周杰伦新歌评论数据.csv

《如果批评说好不哭不自由,则赞美周杰伦无意义》

拼多多_防脱洗发水的商品标题.csv

《在一夜暴富之前,我先一夜秃了头》

下载地址:公众号后台回复“1211”

作者:朱小五,互联网公司数据分析师。热衷于Python爬虫,数据分析,可视化,个人公众号《凹凸玩数据》,有趣的不像个技术号~

End

分享十张表的数据!大家一起玩!

分享十张表的数据!大家一起玩!分享十张表的数据!大家一起玩!

本文转转自微信公众号凹凸数据原创https://mp.weixin.qq.com/s/TtqtDAMMfjnaPkjdkB7wSQ,可扫描二维码进行关注: 分享十张表的数据!大家一起玩! 如有侵权,请联系删除。

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Jacquelyn38 Jacquelyn38
2年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Aidan075 Aidan075
3年前
爬取五大平台621款手机,告诉你双十一在哪买最便宜!
↑关注置顶有趣的不像个技术号今晚0点,相约剁手大家好,我是朱小五明天就是双十一了,看了看自己手里的卡的像IE浏览器的手机,感觉可能等不
Aidan075 Aidan075
3年前
昨晚试试 数据行转列,差点翻了车
作者:朱小五来源:凹凸数据大家好,我是小五昨晚遇到一道数据行转列问题,差点翻了车,跟大家分享一下。先跟大家讲一下,常见的行转列一般是这种形式:通常用来考察“如何用SQL、或者Python实现?”昨天群里有个朋友问了一道类似的题,我张嘴就来。结果拿来测试表一看,翻车了啊!这并不是常见的那种行转列啊!相当于分组筛选,然后横向拼接到一起?这思路也不对啊不过既然
Karen110 Karen110
2年前
​一篇文章总结一下Python库中关于时间的常见操作
前言本次来总结一下关于Python时间的相关操作,有一个有趣的问题。如果你的业务用不到时间相关的操作,你的业务基本上会一直用不到。但是如果你的业务一旦用到了时间操作,你就会发现,淦,到处都是时间操作。。。所以思来想去,还是总结一下吧,本次会采用类型注解方式。time包importtime时间戳从1970年1月1日00:00:00标准时区诞生到现在
Stella981 Stella981
2年前
Python3:sqlalchemy对mysql数据库操作,非sql语句
Python3:sqlalchemy对mysql数据库操作,非sql语句python3authorlizmdatetime2018020110:00:00coding:utf8'''
Wesley13 Wesley13
2年前
4cast
4castpackageloadcsv.KumarAwanish发布:2020122117:43:04.501348作者:KumarAwanish作者邮箱:awanish00@gmail.com首页:
为什么mysql不推荐使用雪花ID作为主键
作者:毛辰飞背景在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建议采用uuid,使用uuid究
Python进阶者 Python进阶者
3个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这