B树与B+树的区别?

Wesley13
• 阅读 649

1.B树简介

B树是一种多路平衡搜索树。它由二叉树变换而来的。定义如下:
1.1每个节点最多有m-1个关键字
1.2根节点最少有1个关键字
1.3非根节点至少有m/2个关键字
1.4每个节点的关键字都是按照从小到大的顺序排列,每个关键字的左子树中的关键字都小于它,而右子树中所有关键字都大于它。
1.5所有的叶子节点都处于同一层,或者说根节点到每个叶子节点的长度都相同
1.6每个节点存储有索引与数据。
因此,根节点的关键字数量范围:1<=k<=m-1;非根节点关键字数量范围m/2<=k<=m-1。
注意:描述一颗B树时必须要指明它的阶数(m),阶数表示一个节点最多有多少个孩子节点。

2.B树插入数据过程

假设5阶B树,则节点最多有4个key,最少有2个key。现要插入6、10、4、14、5、11、15、3、12等数据。
2.1 插入6、10、4、14到根节点,则根节点中数据是4、6、10、14。
2.2 插入5时出现裂变,根节点变成6,左子树节点变成4、5,右子树节点变成10、14。
2.3 接着插入11、15、3三个数据,逐个与根节点比较,比较过程如下:
2.3.1 11与6比较,大于6,则插入6的右子节点,得到数据10、11、14
2.3.2 15与6比较,大于6,则插入6的右子节点,得到数据10、11、14、15
2.3.3 3与6比较,小于6,则插入6的左子节点,得到数据3、4、5
2.3.4 12与6比较,大于6,则插入6的右子节点,得到数据10、11、12、14、15,注意此时又需要裂变了。此时的数据结构如下

根:6
左:3、4、5
右:10、11、12、14、15(需裂变)

很明显,取中间的数据12到根节点,重新得到的平衡树如下

根:6、12
左:3、4、5
中:10、11
右:14、15

裂变的本质是:尽可能使这个树矮,因为矮意味着磁盘I/O次数少。

3.B树删除数据过程

首先查找B树中是否存在需要删除的元素,如果存在,则删除该元素,之后判断该元素是否存在左右孩子节点,如果有,则上移孩子节点中相近元素(左孩子最右边节点或者右孩子最左边节点)到父节点中;如果没有,则直接删除。
假设如上B树中需要删除14、12节点,步骤如下:
3.1 删除14节点,不会对树的平衡有任何影响,所以直接删除了;但是如果接着再删除15节点,就影响树的平衡了,需要重新裂变了。
3.2 删除12节点,12节点左子树有10、11,右子树有15。如果我们将15移上去,得到如下树:

根:6、15
左:3、4、5
右:10、11

我们发现这种树不可能,需要重新裂变;那么我们选择将11移上去,得到如下树:

根:6、11
左:3、4、5
中:10
右:15

我们发现这种树是平衡的,满足要求。

4.B树搜索数据过程

假设我们要搜索节点10,步骤如下:
4.1 10与根节点比较,不等于6,则再跟11比较,发现小于11,那么就会与11的左子树中第一个节点比较,刚好是10,则查询到了。2级查询到数据,则需要操作2次磁盘I/O。从这里我们也可以知道,树越矮,则磁盘操作越少,速度越快。

5.B+树简介

B+树是B树的变种。它与B树的关系如下:
相同点:

1>根节点至少有一个元素
2>非根节点元素范围:m/2<=k<=m-1

不同点:

1>B+树有两种类型节点:内部节点(也称索引节点)与叶子节点。内部节点只存储索引,不存储数据;叶子节点存储数据。
2>每个叶子节点都存有相邻叶子节点的指针,叶子节点本身依关键字有小到大顺序链接。

6.B+树插入数据过程

B+树插入数据与B树插入过程基本相同,不同的是:遇到裂变时,中间key变成根节点,同时中间key要成为右子树的第一个key。
假设5阶B+树,向B+树插入5、8、10、15、16、17、18数据过程如下:
6.1 插入5、8、10、15到根节点,则根节点中索引是5、8、10、15,注意索引中有值。
6.2 再插入16索引,则需要裂变,取索引10作为根节点,10同时要作为右子树第一个索引,得到的数据如下:

根:10
左:5、8
右:10、15、16

6.3 再插入17,不会裂变,插入18时,得到的数据如下:

根:10
左:5、8
右:10、15、16、17、18

此时需要裂变,取中间节点到根节点,得到如下数据:

根:10、16
左:5、8
中:10、15
右:16、17、18

自此结束。
注意:B树与B+树最显著的区别是B+的节点存放索引+数据,B+树内部节点存放索引,叶子节点存储数据。

点赞
收藏
评论区
推荐文章
zhenghaoz zhenghaoz
3年前
算法笔记:红黑树
红黑树,一种平衡二叉树,最为著名的应用就是CSTL中的map,是有序集合最为理想的存储方式之一。除了二叉树所具有的属性之后,红黑树中每个节点多了一个“颜色”属性,可以是红色或者是黑色。一棵红黑树应该满足一下的性质:1.每个节点是红色或者黑色的;2.根节点是黑色的;3.每个叶节点nil是黑色的(使用哨兵节点在删除调整时可以方便不少);4.如
似梦清欢 似梦清欢
1年前
树与二叉树
二叉树层次建树二叉树(BinaryTree)是由有限个结点组成的集合,它或者为空集合,或者仅含一个根结点,或者由一个根结点和两棵互不相交的左、右子树组成。树为空即根节点为空。二叉树的基本形态如下图:a:空的二叉树,treeNULL。b:只有空节点的二叉树,
Stella981 Stella981
2年前
B+树原理以及Java代码实现
最初查找二叉树,由于树的高度会随着有序序列输入而急剧增长,后来出现平衡二叉树,红黑树。B树可以海量数据的快速查询检索,B树主要分为B树(B树),B树,B\树等。B树(B树)M路搜索树,参数M定义节点的分支个数;对于根节点孩子数目为\2,M\,对于其余节点孩子数目为\M/2,M\;每个节点含有关键字属性,至少M/21
Wesley13 Wesley13
2年前
JAVA递归实现线索化二叉树
JAVA递归实现线索化二叉树基础理论首先,二叉树递归遍历分为先序遍历、中序遍历和后序遍历。先序遍历为:根节点左子树右子树中序遍历为:左子树根节点右子树后序遍历为:左子树右子树根节点(只要记住根节点在哪里就是什么遍历,且都是先左再右)线索化现在有这么一棵二叉树,它的数据结
Stella981 Stella981
2年前
LeetCode(98): 验证二叉搜索树
Medium!题目描述:给定一个二叉树,判断其是否是一个有效的二叉搜索树。一个二叉搜索树具有如下特征:节点的左子树只包含小于当前节点的数。节点的右子树只包含大于当前节点的数。所有左子树和右子树自身必须也是二叉搜索树。示例 1:输入:2/\
Wesley13 Wesley13
2年前
PHP数据结构与算法:二叉树
一、定义二叉树是每个节点最多有两个子树的树结构。通常子树被称作“左子树”(leftsubtree)和“右子树”(rightsubtree)。二、特性1.在二叉树的第i层上至多有2^(i1)个结点(i0)2.深度为k的二叉树至多有2^k1个结点(k0)3.对于任意一棵二叉树,如果其叶结点数为N0,而
Wesley13 Wesley13
2年前
B
BTreeBTree又叫做B树,和平衡二叉树不同的地方在于B树是多叉树(平衡多路查找树),Oracle和MongoDB的索引技术就是基于B树的数据结构,B树也可以看作是对23查找树的一种扩展。一个m阶的BTree有以下性质1.每个节点最多有m个子节点;2.每个非叶子节点(根节点除外)至少含有m/2个子节点;3.
Wesley13 Wesley13
2年前
MySql的数据库优化到底优啥了都??(4)
  上回刚刚讲到了BTree这次来简单学学BTree索引  BTree中每个节点包含:  1.本节点所含关键字的个数。  2.指向父节点的指针  3.关键字  4.指向子节点的指针  关于BTree的规则  1.m阶的BTree每个结点至多可以拥有m个子节点,根结点至少有两个子节点  2.根结点的关键字(key)
Wesley13 Wesley13
2年前
98. 验证二叉搜索树
题目描述给定一个二叉树,判断其是否是一个有效的二叉搜索树。假设一个二叉搜索树具有如下特征:节点的左子树只包含小于当前节点的数。节点的右子树只包含大于当前节点的数。所有左子树和右子树自身必须也是二叉搜索树。输入:5/\14 /\ 
菜园前端 菜园前端
11个月前
什么是二叉树?
原文链接:什么是二叉树?树中每个节点最多只能有两个子节点,在JavaScript中一般都是通过Object来模拟二叉树。常用操作前序遍历中序遍历后序遍历前序遍历根左右。口诀:1.访问根节点2.对根节点的左子树进行前序遍历3.对根节点的右子树进行前序遍历通过