【课程合集】深入浅出Greenplum内核,错过的课程都补回来

空空道人
• 阅读 1777
了解更多Greenplum技术干货,欢迎访问Greenplum中文社区网站

为了让大家对Greenplum的内核有更深入的了解,让大家在开发或者是使用Greenplum过程中更加得心应手,2020年,Greenplum中文社区开展了《深入浅出Greenplum内核》系列直播公开课,邀请Greenplum原厂内核讲师,从开发人员视角,理论配合实例,深入浅出地详尽剖析Greenplum主要核心模块,讲解Greenplum模块背后的设计思路和工作原理,让你对Greenplum达到更深层的理解。错过直播的也不用担心,这篇合集带你回顾所有精华内容!文字配合视频,满足你学习的全部需求。相应PPT可前往Greenplum中文网站(cn.greenplum.org)的下载页面获取。

第一课 深入解读开源大数据分析平台Greenplum架构

讲师:杨瑜 Greenplum原厂研发总监


Greenplum被Gartner2019认为是全球十大经典和实时数据分析产品中唯一开源数据库。第一课将逐次梳理Greenplum的四大基本内容:基本概念,数据组织,架构设计和核心模块,理论结合实践,深入浅出的带领大家进入Greenplum的世界。

内容纲要

1、Greenplum 概念及数据的组织

2、Greenplum 体系架构

3、Greenplum 进程模型

4、Greenplum 各大模块

相关阅读:Greenplum架构最详解读(内含视频)

视频:https://www.bilibili.com/vide...

第二课 Greenplum内核揭秘之执行引擎

讲师:唐鹏洲,Greenplum原厂资深研发工程师

第二课为大家详细解说了Greenplum相较于PostgreSQL比较独特的两大模块——Dispatcher和Interconnect,剖析Greenplum是如何通过这两个模块将集群的计算资源调度和串联起来的,并破解了Greenplum的Hashjoin的独到之处。

内容纲要

1、Greenplum执行引擎相关概念

2、与Postgresql引擎的区别

3、Dispatcher 模块

4、Interconnect模块

相关阅读:揭秘!Greenplum并行执行引擎到底是如何工作的?

视频:https://www.bilibili.com/video/BV1Si4y1474L

第三课 Greenplum内核揭秘之查询优化

讲师:郭峰,Greenplum原厂资深研发工程师

第四课为大家介绍了Greenplum中的查询优化器是如何工作的,详细讲述查询优化所经历的几个阶段,以及每个阶段的具体处理过程。涉及到的知识点包括:表达式的预处理、子连接和子查询的提升、外连接的消除、谓词下推、连接顺序限制、动态规划过程等。

内容纲要

1、Greenplum查询优化器

2、Greenplum查询优化器工作原理

3、Greenplum查询优化的四个阶段

4、Greenplum查询优化的具体处理过程

相关阅读:让你的数据库飞起来!Greenplum查询优化解析

视频:https://www.bilibili.com/video/BV1J5411Y7yu

第四课 Greenplum内核揭秘之B树索引

讲师:马洪旭 Greenplum原厂资深研发工程师

索引是数据库中的重要组件,而B树则是最常见的索引数据结构,同时它也是Greenplum中的默认索引类型。第五课详细介绍了B树索引的基础知识,同时深入解析Greenplum的B树实现,包括:索引结构,操作方法与并发控制等。

内容纲要

1、B树基础知识

2、B树存储结构

3、B树操作算法

4、B树并发控制

5、索引相关系统表

相关阅读:要懂Greenplum索引,心里得有B树!

视频:https://www.bilibili.com/video/BV1164y1F7XP

第五课 Greenplum内核揭秘之MVCC并发控制

讲师:陈金豹,Greenplum原厂资深研发工程师

本课程将为大家深度揭秘Greenplum中的MVCC并发控制。第五课将从MVCC的优缺点入手,深度揭秘Greenplum的MVCC并发控制的实现和优化。

内容纲要

1、Greenplum中的MVCC

2、MVCC的优缺点

3、MVCC的实现细节

4、MVCC空间重用

相关阅读:Greenplum MVCC并发控制:严格的一致性与极致的性能

视频:https://www.bilibili.com/video/BV1yT4y1w7Fn

第六课 深入解析Greenplum排序算法

讲师:张桓,Greenplum原厂资深研发工程师

排序在数据库执行器中扮演了重要的角色,除了显示的ORDER BY语句,数据库的聚集、窗口函数中都存在排序算法的身影。第六课为大家介绍了Greenplum执行器中排序节点的原理和实现,以及排序在Greenplum中的应用。

内容纲要

1、排序算法简介

2、Greenplum排序节点原理和实现

3、Greenplum特有的多键排序算法

4、排序在Greenplum中的应用

相关阅读:助你掌握数据库排序算法

视频:https://www.bilibili.com/video/BV17f4y1D76h

第七课 Greenplum分布式事务和两阶段提交协议

讲师:林文 Greenplum原厂资深开发工程师

事务处理是数据库系统的核心能力之一,在Greenplum等分布式数据库上实现更为复杂。本直播将深度解析数据库系统事务的实现原理、分布式事务两阶段提交协议(2PC)的原理以及2PC在Greenplum中的实现和优化。帮助大家了解Greenplum事务处理的实现原理和机制。

内容纲要

1、事务的实现原理和Write Ahead Log

2、分布式事务和两阶段提交的原理

3、Greenplum两阶段提交协议的实现

4、Greenplum两阶段提交协议的优化

相关阅读:终于把分布式事务讲明白了!

视频:https://www.bilibili.com/video/BV1et4y1e7RF

第八课 揭秘Greenplum存储引擎之Heap表

讲师:杨瑜 Greenplum原厂研发总监

存储引擎是数据库底层功能组件,数据库管理系统(DBMS)使用存储引擎高效创建、查询、更新和删除数据。不同的存储引擎提供不同的存储格式、索引支持、并发控制等功能。分布式存储是Greenplum并行化的基石,本课程将带你探索Greenplum存储引擎最本质和基础的问题:Heap存储的实现原理。

内容纲要

1、多版本管理MVCC

2、Heap表页面布局

3、共享缓冲区管理

4、页面访问保护

5、深入元组和属性

相关阅读:万字长文,帮你梳理存储引擎之Heap表关键知识点

视频:https://www.bilibili.com/video/BV1fK4y1j7jJ

第九课 Greenplum高可用理论与实践

讲师:吴昊,Greenplum资深研发工程师

数据库是现代很多与数据相关的程序正常运行的必要组件,数据库的正常运行会直接或间接地影响到程序的可用性,高可用是分布式系统架构设计中必须考虑的因素之一,它通常指,通过设计减少系统不能提供服务的时间。

内容纲要

1、高可用简介

2、高可用的一般性原理

3、日志复制与数据一致性

4、Greenplum的高可用实现FTS

5、Greenplum Master节点的高可用

相关阅读:不惧宕机,数据库高可用理论与实践

视频:https://www.bilibili.com/video/BV1Sz4y167cP

第十课 揭秘Greenplum恢复系统

讲师:郭罡 Greenplum资深研发工程师

系统恢复是一个实用数据库系统不可避免的组件。现实中数据库可能会遇到异常场景,这些场景下数据库需要重启恢复以保持数据一致性和持久性。Greenplum基于经典的预写式日志(WAL)实现恢复系统:出现故障时候首先实现单机系统恢复,必要时候需要介入分布式系统恢复来实现数据全局一致性。

内容纲要

1、恢复系统概述

2、预写日志简介

3、单机系统恢复

4、分布式系统恢复

相关阅读:Greenplum恢复系统知多少

视频:https://www.bilibili.com/video/BV1Ft4y1B74e

看完课程,欢迎大家前往Github,从下载Greenplum源代码开始,走出Contributor的第一步。下载源码时,别忘了给我们加个Star哦!

【课程合集】深入浅出Greenplum内核,错过的课程都补回来

【课程合集】深入浅出Greenplum内核,错过的课程都补回来

点赞
收藏
评论区
推荐文章
blmius blmius
4年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
美凌格栋栋酱 美凌格栋栋酱
7个月前
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Stella981 Stella981
3年前
KVM调整cpu和内存
一.修改kvm虚拟机的配置1、virsheditcentos7找到“memory”和“vcpu”标签,将<namecentos7</name<uuid2220a6d1a36a4fbb8523e078b3dfe795</uuid
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
PHP创建多级树型结构
<!lang:php<?php$areaarray(array('id'1,'pid'0,'name''中国'),array('id'5,'pid'0,'name''美国'),array('id'2,'pid'1,'name''吉林'),array('id'4,'pid'2,'n
Wesley13 Wesley13
3年前
Java日期时间API系列36
  十二时辰,古代劳动人民把一昼夜划分成十二个时段,每一个时段叫一个时辰。二十四小时和十二时辰对照表:时辰时间24时制子时深夜11:00凌晨01:0023:0001:00丑时上午01:00上午03:0001:0003:00寅时上午03:00上午0
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Python进阶者 Python进阶者
1年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这