大数据
课程安排 一、大数据概述 二、大数据处理架构Hadoop 三、分布式文件系统HDFS 四、分布式数据库HBase 五、MapReduce 六、Spark 七、IPythonNotebook运行PythonSpark程序 八、PythonSpark集成开发环境 九、PythonSpark决策树二分类与多分类 十、PythonSpark支持向量机 十一
CuterCorley CuterCorley
4年前
商业数据分析从入门到入职(3)Excel进阶应用
一、数据分类汇总与验证1.分类汇总Excel中的数据可以通过组合实现折叠部分数据,还可以打开数据,如下:如需获取数据进行测试学习,可以直接点击加QQ群<atarget"_blank"href"https://qm.qq.com/cgibin/qm/qr?krgE7cwG7OGHgfEucpRIQoSlYCTOEkmEr&j
Stella981 Stella981
3年前
Python图表数据可视化Seaborn:2. 分类数据可视化
1\.分类数据可视化分类散点图stripplot()/swarmplot()sns.stripplot(x"day",y"total_bill",datatips,jitterTrue,size5,edgecolor'w',linewidth1,ma
Wesley13 Wesley13
3年前
mysql中间件
一.分类为:负载均衡类和数据切分类1.负载均衡中间件提供了请求的转发,降低了单节点的负载,如haproxy,mysqlproxy,mysqlrouter2.数据切分中间件按照不同的路由算法分发sql语句就形成了数据切分,如mycat,atlas,oneproxy,proxysql1.mycatA.开源免费
Wesley13 Wesley13
3年前
2020CCFBDCI通用音频分类CNN方案(0.90+方案)
通用音频分类赛题介绍数据简介import的包音频文件读取特征构造CNN多分类提取预测结果并写入csv文件改进方向参考文献博主继续入门了音频分类问题,根据上一个baseline(https://www.oschina.net/action/
Wesley13 Wesley13
3年前
2、创建分类器笔记
创建分类器\\简介:\\分类是指利用数据的特性将其分类成若干类型的过程。分类与回归不同,回归的输出是实数。监督学习分类器就是用带标记的训练数据建立一个模型,然后对未知的数据进行分类。分类器可以实现分类功能的任意算法,最简单的分类器就是简单的数学函数。其中有二元(binary)分类器,将数据分成两类,也可多元(m
Wesley13 Wesley13
3年前
ACM分类
转载自:http://hi.baidu.com/qinning199/item/34389450e65d669d8d12ed03?qqpftopcqq.group(https://www.oschina.net/action/GoTo
Stella981 Stella981
3年前
Python3获取豆瓣图书标签的前20本热门书籍(一)
介绍第一篇主要获取豆瓣的大分类、大分类下的具体分类以及具体分类下的前20本热门书籍,第二篇对获取的数据进行分析。准备Python3.6、requests、BeautifulSoup4演示!douban(https://img2018.cnblogs.com/blog/423266/20191
大数据——决策树(decision tree)
大数据————决策树(decisiontree)决策树(decisiontree):是一种基本的分类与回归方法,主要讨论分类的决策树。在分类问题中,表示基于特征对实例进行分类的过程,可以认为是ifthen的集合,也可以认为是定义在特征空间
数据治理之数据分类分级
本文分享自天翼云开发者社区《》,作者:徐东为了更好地保护数据安全、提高数据管理效率、确保数据合规性,企业需要对数据进行分类分级,根据数据的密级和敏感程度制定不同的管理和使用策略,尽可能做到有差别和针对性的防护,避免敏感数据的防护不足,非敏感数据的过度防护。