Aidan075 Aidan075
4年前
分享5个高效的pandas函数!
熟练掌握pandas函数都能帮我们在数据分析过程中节省时间。pandas还有很多让人舒适的用法,这次就为大家介绍5个pandas函数!本文来源towardsdatascience,作者SonerYıldırım,由Python大数据分析编译。1\.explodeexplode用于将一行数据展开成多行。比如说dataframe中某一行其中一个元素包含多个同
Stella981 Stella981
4年前
Flink 1.10 和 Hive 3.0 性能对比(附 Demo 演示 PPT)
如今的大数据批计算,随着Hive数仓的成熟,普遍的模式是Hivemetastore计算引擎。常见的计算引擎有HiveonMapReduce、HiveonTez、HiveonSpark、SparkintegrateHive、PrestointegrateHive,还有随着Flink1.10发布后生产可用的Flink
Stella981 Stella981
4年前
Hive出现拒绝连接ConnectionRefused 解决
Causedby:java.net.ConnectException:CallFromnn1.hadoop/192.168.10.6tonn2.hadoop:9000failedonconnectionexception:java.net.ConnectException:拒绝连接;Formoredetailssee:
Wesley13 Wesley13
4年前
VirtualBox、CentOS 6.4、Hadoop、Hive玩起
1 安装VirtualBox:VirtualBox是一款开源免费的并且非常强大的虚拟机软件,同时支持X86和AMD64/Intel64,可以在多个操作系统平台上运行。与同性质的VMWare和VirtualPC比较,VirtualBox独到之处包括支持远程桌面协议RDP、iSCSI及USB的支持。在64为旗舰版Wind
Stella981 Stella981
4年前
Javascript、js 时间日期时间戳转换
1、当前系统区域设置格式(toLocaleDateString和toLocaleTimeString)例子:(newDate()).toLocaleDateString()""(newDate()).toLocaleTimeString()结果:2008年1月29日16:13:112.普通字符串(toDat
Stella981 Stella981
4年前
Hive 练习 简单任务处理
1、2018年4月份的用户数、订单量、销量、GMV (不局限与这些统计量,你也可以自己想一些)2018年4月份的用户数量selectcount(a.user_id)asuser_numsfrom(selectuser_idfrom
Stella981 Stella981
4年前
Hive实战之学生课程成绩
基表:usemyhive;CREATETABLEcourse(idint,sidint,coursestring,scoreint);INSERTINTOcourseVALUES(1,1,'yuwe
Stella981 Stella981
4年前
PHP 生成器Generators的入门理解和学习
什么是生成器Generators生成器允许你在foreach代码块中写代码来迭代一组数据而不需要在内存中创建一个数组,那会使你的内存达到上限,或者会占据可观的处理时间。相反,你可以写一个生成器函数,就像一个普通的自定义函数一样,和普通函数只返回一次不同的是,生成器可以根据需要yield多次,以便生成需要迭代的值。一个简单的例子就
Stella981 Stella981
4年前
HIVE笔记(表的常见操作 )
创建库CREATEDATABASEDATABASENAME;创建表CREATEEXTERNALTABLETABLENAME(FIELDFIELDTYPE,......)PARITITIONEDBY(FIELDTYPE)ROWFORMAT..
Stella981 Stella981
4年前
Hive小知识之分桶抽样
点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源!(https://oscimg.oschina.net/oscnet/5d1ed9fd1b5f4d4c0815c43612661c3c6ce.jpg)!(https://oscimg.oschina.net/oscnet/dc13c086ab4913119194