Wesley13 Wesley13
2年前
Ubuntu16.04下安装Hive
 上一篇博客我们已经说过了要如何安装Hadoop,别忘记了我们的目的是安装Hive。所以这篇博客,我就来介绍一下如何安装Hive。一、环境准备(1)Vmware (2) Ubuntu16.04 (3) Hadoop二、安装Hive (1)mysqlserver和mysqlclient的下载  $suhadoop
Stella981 Stella981
2年前
Hive Transaction 事务性 小试
  提到Hive一般都会想到,Hive是数据仓库,支持类SQL查询,有很多语法支持,可以嵌套MR,写Transform、写UDF/UDAF等,但是,不支持更新操作。所以Hive的常见也一般都是一次写入,频繁读取。从Hive0.13开始,加入了ACID的新feature,但是0.13的时候还不支持insert、update和delete操作,我也
Stella981 Stella981
2年前
HiveQL与SQL区别
1、Hive不支持等值连接•SQL中对两表内联可以写成:•select\fromduala,dualbwherea.keyb.key;•Hive中应为•select\fromdualajoindualbona.keyb.key;而不是传统的格式:SELECTt1.a1as
Stella981 Stella981
2年前
Nebula Exchange 工具 Hive 数据导入的踩坑之旅
!NebulaExchange工具Hive数据导入的踩坑之旅(https://wwwcdn.nebulagraph.com.cn/nebulablog/nebulaexchangehiveimportbestpractice.png)摘要:本文由社区用户xrfinbj贡献,主要介绍Exchange工具从Hive数仓
Stella981 Stella981
2年前
Hive内部表和外部表的区别详解
内部表&外部表未被external修饰的是内部表(managedtable),被external修饰的为外部表(externaltable);区别:内部表数据由Hive自身管理,外部表数据由HDFS管理;内部表数据存储的位置是hive.metastore.warehouse.dir(默认:/user/hive/warehouse)
Stella981 Stella981
2年前
Hive Index
https://cwiki.apache.org/confluence/display/Hive/LanguageManualIndexingOverviewofHiveIndexes
Stella981 Stella981
2年前
Hive基本使用——命令行
Hive用户接口主要有三个:命令行(CLI),客户端(Client)和Web界面(WUI)。其中最常用的是CLI,启动的时候,会同时启动一个Hive服务。Client是Hive的客户端,用户连接至HiveServer。在启动Client模式的时候,需要指出HiveServer所在节点,并且在该节点启动HiveServer。
Stella981 Stella981
2年前
Hive优化的十大方法
Hive用的好,才能从数据中挖掘出更多的信息来。用过hive的朋友,我想或多或少都有类似的经历:一天下来,没跑几次hive,就到下班时间了。Hive在极大数据或者数据不平衡等情况下,表现往往一般,因此也出现了presto、sparksql等替代品。这里重点讲解hive的优化方式,例如优化分组:sethive.auto.convert.join
Stella981 Stella981
2年前
Hive 和普通关系数据库的异同
1.查询语言。由于SQL被广泛的应用在数据仓库中,因此,专门针对Hive的特性设计了类SQL的查询语言HQL。熟悉SQL开发的开发者可以很方便的使用Hive进行开发。2.数据存储位置。Hive是建立在Hadoop之上的,所有Hive的数据都是存储在HDFS(https://www.oschina.net/act
Stella981 Stella981
2年前
Hive使用必知必会系列
一、Hive的几种数据模型内部表(Table将数据保存到Hive自己的数据仓库目录中:/usr/hive/warehouse)外部表(ExternalTable相对于内部表,数据不在自己的数据仓库中,只保存数据的元信息)分区表