算法与数据结构-堆(二叉堆)

算法研
• 阅读 1855

前言

堆(二叉堆),一种动态的树型结构,一种除了底层外,完全被填满二叉树结构。因此,堆一般是基于数组去实现的,它不会出现数组中很多空缺的现象,而造成空间浪费。如下是一个完全二叉树:
算法与数据结构-堆(二叉堆)

它可以用数组表示为[10,7,2,5,1],若以k表示当前数组的索引,那么:

  • 其父节点:floor((k-1)/2)
  • 其左孩子:2k+1
  • 其又孩子:2k+2

结合上图,堆的性质如下:

  • 堆必须是完全二叉树
  • 任一节点要么比其子树节点大,要么小;
  • 根据上面性质,堆被分为最大堆(大顶堆)和最小堆(小顶堆)。

堆的主要用途:

  • 构建优先队列;
  • 支持堆排序;
  • 快速找出集合中的最大值或最小值。

堆结构的基本操作(以最大堆为例,本文均使用vector容器存储数组,假设vector容器的基本操作时间复杂度为Θ(1)):

  • MaxHeap:维护最大堆的性质,时间复杂度O(nlgn);
  • BuildHeap:从无序的输入数据构造一个最大堆,时间复杂度为O(n);

堆结构的基本操作

1.MaxHeap
输入一个数组A和一个下标i,使不满足最大堆性质的A[i]逐级下降,直到满足。

void MaxHeap(vector<int> &A, int i){
    int max; //存储父节点和其子树节点中的最大值下标
    int lef_child = 2i;      //左孩子
    int rig_child = 2i + 1;  //右孩子
    //左孩子大于父节点
    if(lef_child <= A.size() && A[lef_child] > A[i])
        max = lef_child;   
    else max = i;
    //右孩子更大
    if(rig_child <= A.size() && A[rig_child] > A[max])
        max = rig_child;  
    
    //将最大值上移至父节点
    if(max != i){
        //交换
        int temp = A[i]; A[i] = A[max]; A[max] = temp;
        //更新了数组,需继续查看当前元素是否满足最大堆性质
        MaxHeap(A, max);  
    }
}

因为每一个节点子树节点数(包括孩子的孩子)至多为2n/3(n是整个树的节点数,最坏情况即节点为根节点,且底层大于等于半满),所以该算法的时间复杂度为T(n) <= T(2n/3) + Θ(1)通过主方法求解得T(n)=O(lgn),最后因为含n个元素的堆高为O(lgn),所以其时间复杂度又可以表示为O(h)

2.BuildHeap
可以通过自底向上的方法,从最后一个叶节点开始倒序遍历,并调用MaxHeap判断当前节点子树是否满足最大堆性质。

void BuildHeap(vector<int> &A){
    int i = A.size()/2; //最后一个非叶节点的位置
    for(i; i >= 0; i--)  //自底向上维护
        MaxHeap(A, i);
}

该算法的时间复杂度很容易通过,循环n次,每次调用MaxHeap耗费O(lgn),从而得出T(n)=O(nlgn),虽然正确,但是该算法上界还可以继续紧确。

一个含n个元素的堆高(最底层高为0)为floor(lgn),而该堆最多包含ceil(n/2^(h+1))高度为h的节点。而一个高度为h的节点运行MaxHeap的时间复杂度为O(h),所以可以将BuildHeap的总代价表示为:
算法与数据结构-堆(二叉堆)

构建一个优先队列

1.什么是优先队列
优先队列是一种特殊的队列,它不按先进先出的原则,而是以优先度来弹出元素。它本质是一种用来维护由一组元素构成的集合S的数据结构,其中每个元素都有一个相关的值,称为关键字。和堆一样,优先队列也分为最大优先队列和最小优先队列。

2.优先队列的相关操作
HeapTop: 返回并删除掉当前堆顶,时间复杂度为O(lgn)。

int HeapTop(vector<int> &A){
    if(A.size() < 1) exit(0); //没有元素    
    int max = A[0];
    //堆顶等于最后一个值,并将最后一个值弹出
    A[0] = A[A.size()-1];
    A.push_pop();
    //维护最大堆性质
    MaxHeap(A, 0);
    return max;
}

HeapInsert:插入一个元素到当前堆中,时间复杂度为O(lgn)。

void HeapInsert(vector<int> &A, k){
    A.push_back(A[0]);
    A[0] = k;
    //维护最大堆性质
    MaxHeap(A, 0);
}

STL中堆与优先队列的实现

1.堆
heap不属于STL中的容器组件,它是以算法的形式呈现,“默默扮演着幕后英雄”。heap默认是最大堆排序。使用方法如下:

vector<int> ivec{0, 1, 2};
//最大堆[2, 1, 0]
make_heap(ivec.begin(), ivec.end()); 
ivec.push_back(5);
//在堆的基础上进行数据插入[5, 2, 0, 1]
push_heap(ivec.begin(), ivec.end());
//pop_heap并没有删除元素,而是将堆顶元素与最后一个元素进行了替换
//[2, 1, 0, 5]
pop_heap(ivec.begin(), ivec.end());
//删除堆顶的元素[2, 1, 0]
ivec.pop_back();
//默认小堆排序[0, 1, 2]
sort_heap(ivec.begin(), ivec.end());

2.优先队列
priority_queue是STL中优先队列的名称,默认也是最大堆排序。使用方法如下:

priority_queue<int> que;
que.push(x); //每次push之后会自动维护,保证堆顶是优先级别最高的
que.pop();
que.top();

priority_queue还可以自定义存储的数据类型以及排序方式,具体应用可以【关注公众号DoCode,每日一道LeetCode,将零碎时间利用起来】回复关键字“堆”查看。

点赞
收藏
评论区
推荐文章
白茶清欢 白茶清欢
4年前
js实现二叉树、二叉查找树
树是一种数据结构,该章节讨论二叉树(二叉树的每个节点的子节点不允许超过两个),二叉树中有又分为完全二叉树和不完全二叉树.....不在本章节赘述相关概念,感兴趣可以去查阅《数据结构》。你将会获得:1.如何使用js实现二叉查找树。2.学会前、中、后序遍历。3.了解相关实现原理阅读时长5min,可选择直接调试代码特点    二叉查找树中序遍历后
22 22
4年前
一篇文章帮你搞懂二叉堆的那些事
【系列文章推荐阅读】1.什么是二叉堆?“二叉”自不必多说,本章主要介绍的树都是二叉树。那么啥是“堆”呢?我们在日常生活中,通常会说“一堆东西”或者“堆东西”,这里的“堆”,通常指重叠放置的许多东西。我们在堆东西的时候,肯定都有一个经验,即:为了使这堆东西更稳定,会将比较重的、大的东西放在下面,比较轻的、小的东西放在上面。这个经验放在数据结
九路 九路
4年前
4.2 手写Java PriorityQueue 核心源码
上一节介绍了PriorityQueue的原理,先来简单的回顾一下PriorityQueue的原理以最大堆为例来介绍1.PriorityQueue是用一棵完全二叉树实现的。2.不但是棵完全二叉树,而且树中的每个根节点都比它的左右两个孩子节点元素大3.PriorityQueue底层是用数组来保存这棵完全二叉树的。如下图,是一棵最大堆。
22 22
4年前
二叉树创建后,如何使用递归和栈遍历二叉树?
0.前言前文主要介绍了树的相关概念和原理,本文主要内容为二叉树的创建及遍历的代码实现,其中包括递归遍历和栈遍历。1.二叉树的实现思路1.0.顺序存储——数组实现前面介绍了满二叉树和完全二叉树,我们对其进行了编号——从0到n的不中断顺序编号,而恰好,数组也有一个这样的编号——数组下标,只要我们把二者联合起来,数组就能存储二叉树了。那么非满
小恐龙 小恐龙
4年前
彻底搞懂系列B-树、B+树、B-树、B*树
(https://blog.csdn.net/chai471793/article/details/99563704)平衡二叉树概念平衡二叉树是基于二分法的策略提高数据的查找速度的二叉树的数据结构;特点平衡二叉树是采用二分法思维把数据按规则组装成一个树形结构的数据,用这个树形结构的数据减少无关数据的检索,大大
Wesley13 Wesley13
3年前
2020面试题(答案中)
平衡二叉搜索树必须是“平衡”的情况下,其大部分操作的复杂度才能达到O(logn)。你可以按任意顺序位置插入/删除数据,或者使用AVL树或者红黑树,但是在堆中实际上不需要整棵树都是有序的。我们只需要满足对属性即可,所以在堆中平衡不是问题。因为堆中数据的组织方式可以保证O(logn)的性能。搜索在二叉树中搜索会很快,但是在堆中搜索会
Wesley13 Wesley13
3年前
Java数据结构和算法(四)——栈
前面我们讲解了数组,数组更多的是用来进行数据的存储,纯粹用来存储数据的数据结构,我们期望的是插入、删除和查找性能都比较好。对于无序数组,插入快,但是删除和查找都很慢,为了解决这些问题,后面我们会讲解比如二叉树、哈希表的数据结构。  而本篇博客讲解的数据结构和算法更多是用作程序员的工具,它们作为构思算法的辅助工具,而不是完全的数据存储工具。这些数据结构的生
Stella981 Stella981
3年前
Leetcode Lect4 二叉树中的分治法与遍历法
在这一章节的学习中,我们将要学习一个数据结构——二叉树(BinaryTree),和基于二叉树上的搜索算法。在二叉树的搜索中,我们主要使用了分治法(DivideConquer)来解决大部分的问题。之所以大部分二叉树的问题可以使用分治法,是因为二叉树这种数据结构,是一个天然就帮你做好了分治法中“分”这个步骤的结构。本章节的先修内容有:
Stella981 Stella981
3年前
Heapsort 和 priority queue
一、二叉堆含义及属性:堆(heap)亦被称为:优先队列(priorityqueue),是计算机科学中一类特殊的数据结构的统称。堆通常是一个可以被看做一棵完全二叉树的数组对象。在队列中,调度程序反复提取队列中第一个作业并运行,因而实际情况中某些时间较短的任务将等待很长时间才能结束,或者某些不短小,但具有重要性的作业,同样应当具有优先权。堆即为解
菜园前端 菜园前端
2年前
什么是堆?
原文链接:什么是堆?堆是一种特殊的完全二叉树。完全二叉树的含义就是每层节点都完全填满,除了最后一层外只允许最右边缺少若干个节点。在JavaScript中通常用数组表示堆(按照广度优先遍历顺序)。最大堆最小堆特性所有的节点都大于等于它的子节点(最大堆)或者所
贾蔷 贾蔷
2个月前
手搓二叉树构建类代码详解:从入门到实践(适合新手小白)
一、简介和应用二叉树是数据结构中常见的一种树形结构,每个节点最多有两个子节点(左子节点和右子节点)。它广泛应用于算法设计、数据存储与搜索(如二叉搜索树)、表达式解析等领域。本文将通过手写的C代码,讲解如何构建一个基础的二叉树类,帮助新手理解其原理与实现