被“词云”包围的冰冰会更好看吗?安排

Aidan075 等级 1071 0 0
标签: httpspngPython

被“词云”包围的冰冰会更好看吗?安排

大家好,我是小五🐶

昨天「凹凸数据」发了一篇张同学投稿的文章《用Python爬取王冰冰vlog弹幕并制作词云》。发现评论区有一些关于词云的建议,小五决定再安排一下~

爬取弹幕

本来想找张同学要一下弹幕数据,后来一看时间太晚了,干脆自己爬一下算了。

直接利用bilibili_api这个现成的轮子:

被“词云”包围的冰冰会更好看吗?安排

爬虫代码

上图代码可爬取到2000条实时的弹幕,至于评论区所问的历史弹幕怎么爬?实际上bilibili_api这个库也提供了参数可以实现,这次就不展示了,如果大家特别感兴趣,可以给本文一键三连,后面单独出一篇介绍本模块。

被“词云”包围的冰冰会更好看吗?安排

解决办法:

被“词云”包围的冰冰会更好看吗?安排

关于历史弹幕的参数

词云 01

成功获取了2000条弹幕后,先用我最近一年特别喜欢的——stylecloud模块来制作:

def ciyun(data):  
    df = pd.read_csv(data, header=0,encoding='utf-8').astype(str)  
    df['text'] = df['text'].apply(filter_str)  
    text1 = get_cut_words(df.text)  
    name = data.strip('.csv')  
    print(name)  
    stylecloud.gen_stylecloud(text=' '.join(text1), collocations=False,  
                          font_path=r'‪C:\Windows\Fonts\msyh.ttc',  
                          icon_name='fas fa-square',  
                          size=600,  
                          output_name='冰冰.png')

被“词云”包围的冰冰会更好看吗?安排

还阔以嘛

不过今天的目的是实现冰冰被词云包围,那就还需要修改一下蒙版!

词云 02

被“词云”包围的冰冰会更好看吗?安排

首先,按照建议,我反向抠出了背景图片。为了能均匀填充词云,小五又将其背景颜色全部改为黑色。

被“词云”包围的冰冰会更好看吗?安排

利用Python生成词云,这里做过太多次了,省略过程直接看词云成品。

被“词云”包围的冰冰会更好看吗?安排

效果很理想

最后,再用PS简单叠加一下图层就ok啦!

被“词云”包围的冰冰会更好看吗?安排

那么,被词云包围的冰冰变得更好看了吗?

看在冰冰的面子上,给个三连吧~

被“词云”包围的冰冰会更好看吗?安排

后台回复暗号「**进群**」,即刻加入读者交流群~

被“词云”包围的冰冰会更好看吗?安排

本文转转自微信公众号凹凸数据原创https://mp.weixin.qq.com/s/wDtNpaYxj3pn5-3q-ii76w,可扫描二维码进行关注: 被“词云”包围的冰冰会更好看吗?安排 如有侵权,请联系删除。

收藏
评论区

相关推荐

教你用Python制作炫酷的词云
相信大家也都通过各种渠道了解了老干妈与鹅厂的爱恨纠缠,当然其中还混入了迷惑行为的“骗子”、吃瓜吃得飞起的“阿里系”以及连称此事与我无关的“某搜索引擎”。 不过这是一篇技术文,所以无心管他到底是谁的老千妈,一心只想给大家介绍这个惊艳的好东西。 (https://imghelloworld.osscnbeijing.aliyuncs.com/4
被“词云”包围的冰冰会更好看吗?安排
(https://imghelloworld.osscnbeijing.aliyuncs.com/b299933deefc692934e8cc6141ab3894.png) 大家好,我是小五🐶 昨天「凹凸数据」发了一篇张同学投稿的文章《用Python爬取王冰冰vlog弹幕并制作词云(https://mp.weixin.qq.com/
1年前的小五都用 Python 来做什么?
↑ 点击上方 “凹凸数据” 关注 + 星标  每天更新,干货不断   (多图预警) 注:这是小五一年前在知乎的回答,当时还只有凹凸数读一个公众号,所以很多图片都会带有数读或者知乎的水印。 作为一个菜鸟数据分析师,只会sql+python业余时间写写文章:用python爬取数据→数据清洗→数据分析→数据可视化词云镇楼20190730回来看,前面
手把手教你使用Python打造绚丽的词云图
前言大家好,我是黄伟。词云,相信大家对这个概念比较陌生,它其实就是指的是对某一段文本中出现频率最高的关键词进行特殊描绘,过滤到太多没用的字眼,以此达到视觉上的突出,让人一看就知道这篇文章讲的什么。 一、词云的运用设计到的模块:wordcloud编辑器:sublime text 3编译器:Python 3.6 1.下载安装wordcloud模块pip ins
AWS吹走了私有云天空中最后一片乌云
长久以来,私有云厂商都被一朵乌云笼罩着:私有云是否是一个伪命题,这个世界是否终将被公有云统治?无论如何振振有词,当2006年3月14日亚马逊向全世界公开其公有云服务AWS时,IT的历史车轮就碾入了公有云纪元,传统IT厂商不得不面对AWS这个门外的野蛮人。关于私有云,AWS CTO Werner Vogels在2010年就做出了他的论断,Vogels称所谓的私
HTTPS就安全了吗?会被抓包吗?看完这篇你有对答如流
![](https://oscimg.oschina.net/oscnet/4b59be60e0f62ed21d975f8fab2c64d7357.jpg) 作者:leapMie cnblogs.com/leap/p/11953836.html 关注Vue中文社区,每日精选好文 ### **HTTPS**
2020 7月 百度搜索词获取最新版
2020年7月相信大家很多人都获取不到百度的搜索词了 百度五月份发出通告下线推广流量referer中搜索关键词 ![](https://img2020.cnblogs.com/blog/1615842/202008/1615842-20200803172115050-181499106.png) 目前获取SEM的搜索词(广告链接的)只能通过最新版的百度
COSCon’20 云原生与微服务专场,Pulsar 分享也「来势汹汹」
![](https://oscimg.oschina.net/oscnet/3cb62fa1-deab-4d8a-abaf-f853ff7ca1f2.png) ![](https://oscimg.oschina.net/oscnet/830b4d95-b192-4a57-8bb1-da292d918d40.png) 有一幅曾经传
Python 3 教程
Python 3 教程 =========== ![python3](https://www.runoob.com/wp-content/uploads/2014/05/python3.png) Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,
Python 什么时候会被取代?
![](https://oscimg.oschina.net/oscnet/4e755c25d09a136682cfbbbd8aad8b89c4c.jpg) 编译:CSDN-弯月,作者:Rhea MoutafisPython 经过了几十年的努力才得到了编程社区的赏识。自 2010 年以来,Python 得到了蓬勃发展,并最终超越了 C、C#、Java 和
Python 什么是元类(metaclasses)?
**1.什么是类** ---------- 在理解元类之前,我们必须先掌握Python中的类(class)。 和大多数语言一样,Python中的类知识用来描述如何“生成一个对象”: ![](https://oscimg.oschina.net/oscnet/8c9c532a-0949-42bf-9a21-833c7b247338.png) 但是
Python数据可视化
Python数据可视化 -- Wordcloud ------------------------ ### 安装 启动命令行,输入:pip install wordcloud ### word cloud 库介绍 及简单使用 wordcloud库,可以说是python非常优秀的词云展示第三方库。词云以词语为基本单位更加直
Python生成词云
1 概述 ==== 利用Python生成简单的词云,需要的工具是cython,wordcloud与anaconda. 2 准备工作 ====== 包括安装cython,wordcloud与anaconda. 2.1 安装anaconda -------------- [下载官网](https://www.oschina.net/action/GoT
python访问百度关键词和链接
前几天在Python交流群有个同学分享了一份Python网络爬虫代码,用来获取某度关键词和链接的。其实这个需求之前我也写过代码,不过网页结构变化之后,之前的提取器已经失效了,所以代码就作废了。今天这里给再给大家分享一个使用python获取某度关键词的实践。由于某度也是设置反爬安全策略的,所有同一IP下程序运行次数多了也是会被封IP的,所有在访问过程中我们需要
撑算力之帆,天翼云助力数字时代逐潮者远航
数字经济作为近年来的热门词汇,在国家重要会议中被反复提及,大数据显示,2022年两会举办前夕,“数字经济”相关内容搜索热度同比增长96%,成为两会热门话题TOP5。数字经济的持续热度,也从侧面证明国内各行业数字化转型已进入新阶段,他们从传统的IT上云,到DT/OT/CT全面云化,大带宽、低延时、高算力,数据安全等成为更多企业用户的基础需求。而边缘云服务以靠近