hive所有文章-最新hive相关文章汇总-第2页-HelloWorld开发者社区

•

4年前

上一篇博客我们已经说过了要如何安装Hadoop，别忘记了我们的目的是安装Hive。所以这篇博客，我就来介绍一下如何安装Hive。一、环境准备（1）Vmware (2) Ubuntu16.04 (3) Hadoop二、安装Hive　(1)mysqlserver和mysqlclient的下载　　$suhadoop

Stella981

•

4年前

Hive Transaction 事务性小试

提到Hive一般都会想到，Hive是数据仓库，支持类SQL查询，有很多语法支持，可以嵌套MR，写Transform、写UDF/UDAF等，但是，不支持更新操作。所以Hive的常见也一般都是一次写入，频繁读取。从Hive0.13开始，加入了ACID的新feature，但是0.13的时候还不支持insert、update和delete操作，我也

Stella981

•

4年前

HiveQL与SQL区别

1、Hive不支持等值连接•SQL中对两表内联可以写成：•select\fromduala,dualbwherea.keyb.key;•Hive中应为•select\fromdualajoindualbona.keyb.key;而不是传统的格式：SELECTt1.a1as

Stella981

•

4年前

Nebula Exchange 工具 Hive 数据导入的踩坑之旅

!NebulaExchange工具Hive数据导入的踩坑之旅(https://wwwcdn.nebulagraph.com.cn/nebulablog/nebulaexchangehiveimportbestpractice.png)摘要：本文由社区用户xrfinbj贡献，主要介绍Exchange工具从Hive数仓

Stella981

•

4年前

Hive内部表和外部表的区别详解

内部表&外部表未被external修饰的是内部表（managedtable），被external修饰的为外部表（externaltable）；区别：内部表数据由Hive自身管理，外部表数据由HDFS管理；内部表数据存储的位置是hive.metastore.warehouse.dir（默认：/user/hive/warehouse）

Stella981

•

4年前

Hive Index

https://cwiki.apache.org/confluence/display/Hive/LanguageManualIndexingOverviewofHiveIndexes

Stella981

•

4年前

Hive基本使用——命令行

Hive用户接口主要有三个：命令行(CLI)，客户端(Client)和Web界面(WUI)。其中最常用的是CLI，启动的时候，会同时启动一个Hive服务。Client是Hive的客户端，用户连接至HiveServer。在启动Client模式的时候，需要指出HiveServer所在节点，并且在该节点启动HiveServer。

Stella981

•

4年前

Hive优化的十大方法

Hive用的好，才能从数据中挖掘出更多的信息来。用过hive的朋友，我想或多或少都有类似的经历：一天下来，没跑几次hive，就到下班时间了。Hive在极大数据或者数据不平衡等情况下，表现往往一般，因此也出现了presto、sparksql等替代品。这里重点讲解hive的优化方式，例如优化分组：sethive.auto.convert.join

Stella981

•

4年前

Hive 和普通关系数据库的异同

1.查询语言。由于SQL被广泛的应用在数据仓库中，因此，专门针对Hive的特性设计了类SQL的查询语言HQL。熟悉SQL开发的开发者可以很方便的使用Hive进行开发。2.数据存储位置。Hive是建立在Hadoop之上的，所有Hive的数据都是存储在HDFS(https://www.oschina.net/act

Stella981

•

4年前

Hive使用必知必会系列

一、Hive的几种数据模型内部表(Table将数据保存到Hive自己的数据仓库目录中：/usr/hive/warehouse)外部表(ExternalTable相对于内部表，数据不在自己的数据仓库中，只保存数据的元信息)分区表