hbase所有文章-最新hbase相关文章汇总-第8页-HelloWorld开发者社区

•

4年前

1、前言　　本文是在《如何计算实时热门商品》(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fwuchong.me%2Fblog%2F2018%2F11%2F07%2Fuseflinkcalculatehotitems%2F)\1\一文上做的扩展，

Wesley13

•

4年前

HDP3.1 中 YRAN 和 MR2 的内存大小配置的计算方式

Container 是 YARN 中基本的处理单元，它是对内存、CPU等计算的封装。总的来说，每个core每块硬盘分配2个 container，能获得较好的集群利用率。 1. 确定可用内存大小。对于每台主机来说，YARN 和 MapReduce 能用内存大小是除去预留给系统的内存（如果还有 HBase，还要相应留内存给它）后的大小，即

Stella981

•

4年前

OpenTSDB时序数据库的应用

OpenTSDBOpenTSDB是基于Hbase的时序数据库，它是一个时间序列专用数据库，只能存储时序数据。官方定位是一个分布式、可伸缩的监控系统。譬如收集大规模集群（包括网络设备、操作系统、应用程序）的监控数据并进行存储，查询。官网(https://www.oschina.net/action/GoToLink?urlhtt

Stella981

•

4年前

Hadoop 中利用 mapreduce 读写 mysql 数据

有时候我们在项目中会遇到输入结果集很大，但是输出结果很小，比如一些pv、uv数据，然后为了实时查询的需求，或者一些OLAP的需求，我们需要mapreduce与mysql进行数据的交互，而这些特性正是hbase或者hive目前亟待改进的地方。好了言归正传，简单的说说背景、原理以及需要注意的地方：1、为了方便MapReduce

Stella981

•

4年前

DataX介绍

一.DataX3.0概览DataX是一个异构数据源离线同步工具，致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。!(https://oscimg.oschina.net/oscnet/267abfdb4b4d98dada7551c730af4

Stella981

•

4年前

Log Structured Merge Trees(LSM) 算法

十年前，谷歌发表了“BigTable”的论文，论文中很多很酷的方面之一就是它所使用的文件组织方式，这个方法更一般的名字叫LogStructuredMergeTree。LSM是当前被用在许多产品的文件结构策略：HBase,Cassandra,LevelDB,SQLite,甚至在mangodb3.0中也带了一个可选的LSM引擎（Wired

Stella981

•

4年前

Hadoop生态圈

Stella981

•

4年前

Hive和HBase有哪些区别与联系及适用场景

hiveHive是运行在Hadoop上的一个工具，准确地讲是一个搜索工具。当对海量数据进行搜索时，Hadoop的计算引擎是MapReduce。但是对MapReduce的操作和编程是非常复杂的。于是Hive的存在就让复杂的编程过程简化成了用SQL语言对海量数据的操作。这大大减轻了程序员的工作量。可以说，Hive的存在让海量数据的增删改查更加方便。

Stella981

•

4年前

BigData NoSQL —— ApsaraDB HBase数据存储与分析平台概览

一、引言时间到了2019年，数据库也发展到了一个新的拐点，有三个明显的趋势：1.越来越多的数据库会做云原生(CloudNative)，会不断利用新的硬件及云本身的优势打造CloudNative数据库，国内以阿里云的CloudHBase(https://www.oschina.net/action/GoToLink?urlhttps

Wesley13

•

4年前

Java面试之Zookeeper

157\.zookeeper是什么？zookeeper是一个分布式的，开放源码的分布式应用程序协调服务，是googlechubby的开源实现，是hadoop和hbase的重要组件。它是一个为分布式应用提供一致性服务的软件，提供的功能包括：配置维护、域名服务、分布式同步、组服务等。158\.zook