DevOpSec DevOpSec
1年前
Kafka topic leader 均衡
Kafkatopicleader均衡(about:blank%E8%83%8C%E6%99%AF"背景")背景在创建一个topic时,partition会在Br
Stella981 Stella981
2年前
Hive on spark下insert overwrite partition慢的优化
  Hive版本:2.1.1,Spark版本是1.6.0  这几天发现insertoverwritepartition运行的很慢,看了下是hiveonspark引擎,这引擎平时比mapreduce快多了,但是怎么今天感觉比mapreduce慢了好几倍,运行了1h多还没运行完。  将SQL拿来手动hivef文件.sql执行
Stella981 Stella981
2年前
Kafka(3)
消息的存储原理:  消息的文件存储机制:  前面我们知道了一个topic的多个partition在物理磁盘上的保存路径,那么我们再来分析日志的存储方式。通过   \root@localhost~\ls/tmp/kafkalogs/firstTopic1/命令找到对应partition下的日志内容
Stella981 Stella981
2年前
Spark Cache源代码分析
1\.sparkcache原理Task运行的时候是要去获取Parent的RDD对应的Partition的数据的,即它会调用RDD的iterator方法把对应的Partition的数据集给遍历出来,具体流程如下图:!在这里插入图片描述(https://imgblog.csdnimg.cn/20200724165519878.pn
Stella981 Stella981
2年前
MapReduce中combine、partition、shuffle的作用是什么
概括:combine和partition都是函数。中间的步骤应该仅仅有shuffle!1.combinecombine分为map端和reduce端,作用是把同一个key的键值对合并在一起,能够自己定义的。combine函数把一个map函数产生的<key,value对(多个key,value)合并成一个新的<key2,value
Wesley13 Wesley13
2年前
voltdb 优化数据库使用方法
方法一、partitioning!(http://static.oschina.net/uploads/space/2016/0608/155940_ZDmx_2308739.png)此图是一个通过patitioning方法,按照相关列,将数据分发到集群当中不同的partition上面。然后通过存储过程,去
Stella981 Stella981
2年前
Kafka 自定义指定消息partition策略规则及DefaultPartitioner源码分析
Kafka自定义指定消息partition策略规则及DefaultPartitioner源码分析一.概述kafka默认使用DefaultPartitioner类作为默认的partition策略规则,具体默认设置是在ProducerConfi
Wesley13 Wesley13
2年前
MySQL 存储过程中执行DDL
一、定期增加表分区1、增加表分区例CREATEDEFINER\root\@\127.0.0.1\PROCEDURE\p\_create\_Partition\(INdatabaseNameVARCHAR(50),INtableNameVARCHAR(50))L\_END:BEGIN   DECLAREV\_
Easter79 Easter79
2年前
Trident API(翻译)
TridentAPIOverviewTrident的核心数据模型是“流”(Stream),进行数据处理的时候,将数据作为一系列的batch(批)来进行。流被分割成多个partition分布在集群中的不同节点上来运行,而且对流的操作也是在流的各个partition上并行运行的。Trident中有五类操作
Stella981 Stella981
2年前
LeetCode撸代码之:561. Array Partition I
答案:importjava.util.Arrays;classSolution{publicintarrayPairSum(intnums){selectSort(nums);intlennums.length;