某区块链公司竟然用这道算法题来面试

柳土獐
• 阅读 2736

最近有粉丝和我交流面试遇到的算法题。其中有一道题比较有意思,分享给大家。

ta 说自己面试了一家某大型区块链的公司的前端岗位,被问到了一道算法题。这道题也是一个非常常见的题目了,力扣中也有原题 110. 平衡二叉树,难度为简单。

不过面试官做了一点点小的扩展,难度瞬间升级了。我们来看下面试官做了什么扩展。

题目

题目是《判断一棵树是否为平衡二叉树》,所谓平衡二叉树指的是二叉树中所有节点的左右子树的深度之差不超过 1。输入参数是二叉树的根节点 root,输出是一个 bool 值。

代码会被以如下的方式调用:

console.log(isBalance([3, 9, 2, null, null, 5, 5]));

console.log(isBalance([1, 1, 2, 3, 4, null, null, 4, 4]));

思路

求解的思路就是围绕着二叉树的定义来进行即可。

对于二叉树中的每一个节点都:

  • 分别计算左右子树的高度,如果高度差大于 1,直接返回 false
  • 否则继续递归调用左右子节点,如果左右子节点全部都是平衡二叉树,那么返回 true。否则返回 false

可以看出我们的算法就是死扣定义

计算节点深度比较容易,既可以使用前序遍历 + 参考扩展的方式,也可使用后序遍历的方式,这里我用的是前序遍历 + 参数扩展

对此不熟悉的强烈建议看一下这篇文章 几乎刷完了力扣所有的树题,我发现了这些东西。。。

于是你可以写出如下的代码。

function getDepth(root, d = 0) {
  if (!root) return 0;
  return max(getDepth(root.left, d + 1), getDepth(root.right, d + 1));
}

function dfs(root) {
  if (!root) return true;
  if (abs(getDepth(root.left), getDepth(root.right)) > 1) return false;
  return dfs(root.left) && dfs(root.right);
}

function isBalance(root) {
  return dfs(root);
}

不难发现,这道题的结果和节点(TreeNode) 的 val 没有任何关系,val 是多少完全不影响结果。

这就完了么?

可以仔细观察题目给的使用示例,会发现题目给的是 nodes 数组,并不是二叉树的根节点 root。

因此我们需要先构建二叉树。 构建二叉树本质上是一个反序列的过程。要想知道如何反序列化,肯定要先知道序列化。

而二叉树序列的方法有很多啊?题目给的是哪种呢?这需要你和面试官沟通。很有可能面试官在等着你问他呢!!!

反序列化

我们先来看下什么是序列化,以下定义来自维基百科:

序列化(serialization)在计算机科学的数据处理中,是指将数据结构或对象状态转换成可取用格式(例如存成文件,存于缓冲,或经由网络中发送),以留待后续在相同或另一台计算机环境中,能恢复原先状态的过程。依照序列化格式重新获取字节的结果时,可以利用它来产生与原始对象相同语义的副本。对于许多对象,像是使用大量引用的复杂对象,这种序列化重建的过程并不容易。面向对象中的对象序列化,并不概括之前原始对象所关系的函数。这种过程也称为对象编组(marshalling)。从一系列字节提取数据结构的反向操作,是反序列化(也称为解编组、deserialization、unmarshalling)。

可见,序列化和反序列化在计算机科学中的应用还是非常广泛的。就拿 LeetCode 平台来说,其允许用户输入形如:

[1,2,3,null,null,4,5]

这样的数据结构来描述一颗树:

某区块链公司竟然用这道算法题来面试

([1,2,3,null,null,4,5] 对应的二叉树)

其实序列化和反序列化只是一个概念,不是一种具体的算法,而是很多的算法。并且针对不同的数据结构,算法也会不一样。

前置知识

阅读本文之前,需要你对树的遍历以及 BFS 和 DFS 比较熟悉。如果你还不熟悉,推荐阅读一下相关文章之后再来看。或者我这边也写了一个总结性的文章二叉树的遍历,你也可以看看。

前言

我们知道:二叉树的深度优先遍历,根据访问根节点的顺序不同,可以将其分为前序遍历中序遍历, 后序遍历。即如果先访问根节点就是前序遍历,最后访问根节点就是后序遍历,其它则是中序遍历。而左右节点的相对顺序是不会变的,一定是先左后右。

当然也可以设定为先右后左。

并且知道了三种遍历结果中的任意两种即可还原出原有的树结构。这不就是序列化和反序列化么?如果对这个比较陌生的同学建议看看我之前写的《构造二叉树系列》

有了这样一个前提之后算法就自然而然了。即先对二叉树进行两次不同的遍历,不妨假设按照前序和中序进行两次遍历。然后将两次遍历结果序列化,比如将两次遍历结果以逗号“,” join 成一个字符串。 之后将字符串反序列即可,比如将其以逗号“,” split 成一个数组。

序列化:

class Solution:
    def preorder(self, root: TreeNode):
        if not root: return []
        return [str(root.val)] +self. preorder(root.left) + self.preorder(root.right)
    def inorder(self, root: TreeNode):
        if not root: return []
        return  self.inorder(root.left) + [str(root.val)] + self.inorder(root.right)
    def serialize(self, root):
        ans = ''
        ans += ','.join(self.preorder(root))
        ans += '$'
        ans += ','.join(self.inorder(root))

        return ans

反序列化:

这里我直接用了力扣 105. 从前序与中序遍历序列构造二叉树 的解法,一行代码都不改。

class Solution:
    def deserialize(self, data: str):
        preorder, inorder = data.split('$')
        if not preorder: return None
        return self.buildTree(preorder.split(','), inorder.split(','))

    def buildTree(self, preorder: List[int], inorder: List[int]) -> TreeNode:
        # 实际上inorder 和 preorder 一定是同时为空的,因此你无论判断哪个都行
        if not preorder:
            return None
        root = TreeNode(preorder[0])

        i = inorder.index(root.val)
        root.left = self.buildTree(preorder[1:i + 1], inorder[:i])
        root.right = self.buildTree(preorder[i + 1:], inorder[i+1:])

        return root

实际上这个算法是不一定成立的,原因在于树的节点可能存在重复元素。也就是说我前面说的知道了三种遍历结果中的任意两种即可还原出原有的树结构是不对的,严格来说应该是如果树中不存在重复的元素,那么知道了三种遍历结果中的任意两种即可还原出原有的树结构

聪明的你应该发现了,上面我的代码用了 i = inorder.index(root.val),如果存在重复元素,那么得到的索引 i 就可能不是准确的。但是,如果题目限定了没有重复元素则可以用这种算法。但是现实中不出现重复元素不太现实,因此需要考虑其他方法。那究竟是什么样的方法呢?

答案是记录空节点。接下来进入正题。

DFS

序列化

我们来模仿一下力扣的记法。 比如:[1,2,3,null,null,4,5](本质上是 BFS 层次遍历),对应的树如下:

选择这种记法,而不是 DFS 的记法的原因是看起来比较直观。并不代表我们这里是要讲 BFS 的序列化和反序列化。

某区块链公司竟然用这道算法题来面试

序列化的代码非常简单, 我们只需要在普通的遍历基础上,增加对空节点的输出即可(普通的遍历是不处理空节点的)。

比如我们都树进行一次前序遍历的同时增加空节点的处理。选择前序遍历的原因是容易知道根节点的位置,并且代码好写,不信你可以试试。

因此序列化就仅仅是普通的 DFS 而已,直接给大家看看代码。

Python 代码:

class Codec:
    def serialize_dfs(self, root, ans):
        # 空节点也需要序列化,否则无法唯一确定一棵树,后不赘述。
        if not root: return ans + '#,'
        # 节点之间通过逗号(,)分割
        ans += str(root.val) + ','
        ans = self.serialize_dfs(root.left, ans)
        ans = self.serialize_dfs(root.right, ans)
        return ans
    def serialize(self, root):
        # 由于最后会添加一个额外的逗号,因此需要去除最后一个字符,后不赘述。
        return self.serialize_dfs(root, '')[:-1]

Java 代码:

public class Codec {
    public String serialize_dfs(TreeNode root, String str) {
        if (root == null) {
            str += "None,";
        } else {
            str += str.valueOf(root.val) + ",";
            str = serialize_dfs(root.left, str);
            str = serialize_dfs(root.right, str);
        }
        return str;
    }

    public String serialize(TreeNode root) {
        return serialize_dfs(root, "");
    }
}

[1,2,3,null,null,4,5] 会被处理为1,2,#,#,3,4,#,#,5,#,#

我们先看一个短视频:

某区块链公司竟然用这道算法题来面试

(动画来自力扣)

反序列化

反序列化的第一步就是将其展开。以上面的例子来说,则会变成数组:[1,2,#,#,3,4,#,#,5,#,#],然后我们同样执行一次前序遍历,每次处理一个元素,重建即可。由于我们采用的前序遍历,因此第一个是根元素,下一个是其左子节点,下下一个是其右子节点。

Python 代码:

    def deserialize_dfs(self, nodes):
        if nodes:
            if nodes[0] == '#':
                nodes.pop(0)
                return None
            root = TreeNode(nodes.pop(0))
            root.left = self.deserialize_dfs(nodes)
            root.right = self.deserialize_dfs(nodes)
            return root
        return None

    def deserialize(self, data: str):
        nodes = data.split(',')
        return self.deserialize_dfs(nodes)

Java 代码:

    public TreeNode deserialize_dfs(List<String> l) {
        if (l.get(0).equals("None")) {
            l.remove(0);
            return null;
        }

        TreeNode root = new TreeNode(Integer.valueOf(l.get(0)));
        l.remove(0);
        root.left = deserialize_dfs(l);
        root.right = deserialize_dfs(l);

        return root;
    }

    public TreeNode deserialize(String data) {
        String[] data_array = data.split(",");
        List<String> data_list = new LinkedList<String>(Arrays.asList(data_array));
        return deserialize_dfs(data_list);
    }

复杂度分析

  • 时间复杂度:每个节点都会被处理一次,因此时间复杂度为 $O(N)$,其中 $N$ 为节点的总数。
  • 空间复杂度:空间复杂度取决于栈深度,因此空间复杂度为 $O(h)$,其中 $h$ 为树的深度。

BFS

序列化

实际上我们也可以使用 BFS 的方式来表示一棵树。在这一点上其实就和力扣的记法是一致的了。

我们知道层次遍历的时候实际上是有层次的。只不过有的题目需要你记录每一个节点的层次信息,有些则不需要。

这其实就是一个朴实无华的 BFS,唯一不同则是增加了空节点。

Python 代码:


class Codec:
    def serialize(self, root):
        ans = ''
        queue = [root]
        while queue:
            node = queue.pop(0)
            if node:
                ans += str(node.val) + ','
                queue.append(node.left)
                queue.append(node.right)
            else:
                ans += '#,'
        return ans[:-1]

反序列化

如图有这样一棵树:

某区块链公司竟然用这道算法题来面试

那么其层次遍历为 [1,2,3,#,#, 4, 5]。我们根据此层次遍历的结果来看下如何还原二叉树,如下是我画的一个示意图:

某区块链公司竟然用这道算法题来面试

动画演示:

某区块链公司竟然用这道算法题来面试

容易看出:

  • level x 的节点一定指向 level x + 1 的节点,如何找到 level + 1 呢? 这很容易通过层次遍历来做到。
  • 对于给的的 level x,从左到右依次对应 level x + 1 的节点,即第 1 个节点的左右子节点对应下一层的第 1 个和第 2 个节点,第 2 个节点的左右子节点对应下一层的第 3 个和第 4 个节点。。。
  • 接上,其实如果你仔细观察的话,实际上 level x 和 level x + 1 的判断是无需特别判断的。我们可以把思路逆转过来:即第 1 个节点的左右子节点对应第 1 个和第 2 个节点,第 2 个节点的左右子节点对应第 3 个和第 4 个节点。。。(注意,没了下一层三个字)

因此我们的思路也是同样的 BFS,并依次连接左右节点。

Python 代码:

    def deserialize(self, data: str):
        if data == '#': return None
        # 数据准备
        nodes = data.split(',')
        if not nodes: return None
        # BFS
        root = TreeNode(nodes[0])
        queue = collections.deque([root])
        # 已经有 root 了,因此从 1 开始
        i = 1

        while i < len(nodes) - 1:
            node = queue.popleft()
            lv = nodes[i]
            rv = nodes[i + 1]
            i += 2
            # 对于给的的 level x,从左到右依次对应 level x + 1 的节点
            # node 是 level x 的节点,l 和 r 则是 level x + 1 的节点
            if lv != '#':
                l = TreeNode(lv)
                node.left = l
                queue.append(l)

            if rv != '#':
                r = TreeNode(rv)
                node.right = r
                queue.append(r)
        return root

复杂度分析

  • 时间复杂度:每个节点都会被处理一次,因此时间复杂度为 $O(N)$,其中 $N$ 为节点的总数。
  • 空间复杂度:$O(N)$,其中 $N$ 为节点的总数。

这样就结束了吗?

有了上面的序列化的知识。

我们就可以问面试官是哪种序列化的手段。 并针对性选择反序列化方案构造出二叉树。最后再使用本文开头的方法解决即可。

以为这里就结束了吗?

并没有!面试官让他说出自己的复杂度。

读到这里,不妨自己暂停一下,思考这个解法的复杂度是多少?

1

2

3

4

5

ok,我们来揭秘。

时间复杂度是 $O(n) + O(n^2)$,其中 $O(n)$ 是生成树的时间,$O(n^2)$ 是判断是否是平衡二叉树的时间。

为什么判断平衡二叉树的时间复杂度是 $O(n^2)$? 这是因为我们对每一个节点都计算其深度,因此总的时间为所有节点深度之和,最差情况是退化到链表的情况,此时的高度之和为 $1 + 2 + ... n$ ,根据等差数列求和公式可知,时间复杂度是 $O(n^2)$。

空间复杂度很明显是 $O(n)$。这其中包括了构建二叉树的 n 以及递归栈的开销。

面试官又追问:可以优化么?

读到这里,不妨自己暂停一下,思考这个解法的复杂度是多少?

1

2

3

4

5

ok,我们来揭秘。

优化的手段有两种。第一种是:

  • 空间换时间。将 getDepth 函数的返回值记录下来,确保多次执行 getDepth 且参数相同的情况不会重复执行。这样时间复杂度可以降低到 $O(n)$
  • 第二种方法和上面的方法是类似的,其本质是记忆化递归(和动态规划类似)。
我在上一篇文章 读者:西法,记忆化递归究竟怎么改成动态规划啊? 详细讲述了记忆化递归和动态规划的互相转换。如果你看了的话,会发现这里就是记忆化递归。

第一种方法代码比较简单,就不写了。这里给一下第二种方法的代码。

定义函数 getDepth(root) 返回 root 的深度。 需要注意的是,如果子节点不平衡,直接返回 -1。 这样上面的两个函数功能(getDepth 和 isBalance)就可以放到一个函数中执行了。

class Solution:
    def isBalanced(self, root: TreeNode) -> bool:
        def getDepth(root: TreeNode) -> int:
            if not root:
                return 0
            lh = getDepth(root.left)
            rh = getDepth(root.right)
            # lh == -1 表示左子树不平衡
            # rh == -1 表示右子树不平衡
            if lh == -1 or rh == -1 or abs(rh - lh) > 1:
                return -1
            return max(lh, rh) + 1

        return getDepth(root) != -1

总结

虽然这道面试题目是一个常见的常规题。不过参数改了一下,瞬间难度就上来了。如果面试官没有直接给你说 nodes 是怎么序列化来的,他可能是故意的。二叉树序列的方法有很多啊?题目给的是哪种呢?这需要你和面试官沟通。很有可能面试官在等着你问他呢!!! 这正是这道题的难点所在。

构造二叉树本质就是一个二叉树反序列的过程。 而如何反序列化需要结合序列化算法。

序列化方法根据是否存储空节点可以分为:存储空节点和不存储空节点。

存储空节点会造成空间的浪费,不存储空节点会造成无法唯一确定一个包含重复值的树。

而关于序列化,本文主要讲述的是二叉树的序列化和反序列化。看完本文之后,你就可以放心大胆地去 AC 以下两道题:

另外仅仅是暴力做出来还不够,大家要对自己提出更高的要求。

最起码你要会分析自己的算法,常用的就是复杂度分析。进一步如果你可以对算法进行优化会很加分。比如这里我就通过两种优化方法将时间优化到了 $O(n)$。

以上就是本文的全部内容了, 大家对此有何看法,欢迎给我留言,我有时间都会一一查看回答。我是 lucifer,维护西湖区最好的算法题解,Github 超 40K star 。大家也可以关注我的公众号《力扣加加》带你啃下算法这块硬骨头。
另外我整理的 1000 多页的电子书已限时免费下载,大家可以去我的公众号《力扣加加》后台回复电子书获取。

点赞
收藏
评论区
推荐文章
blmius blmius
4年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
Wesley13 Wesley13
4年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Wesley13 Wesley13
4年前
AI面试刷题版
(1)代码题(leetcode类型),主要考察数据结构和基础算法,以及代码基本功虽然这部分跟机器学习,深度学习关系不大,但也是面试的重中之重。基本每家公司的面试都问了大量的算法题和代码题,即使是商汤、face这样的深度学习公司,考察这部分的时间也占到了我很多轮面试的60%甚至70%以上。我去face面试的时候,面试官是residualnet,s
Wesley13 Wesley13
4年前
2020字节高频算法题
字节跳动现在是非常火热的哈,小伙伴们都极为关注。每天都有许多人在面试,有很多童鞋在牛客网写面经,阅读量都非常高。大家都知道字节跳动面试的特色哈,面试必定是要手撕算法的哈~总结了最近两月字节跳动提前批的算法题,大都数都是leetcode上的原题哈,也有一部分是剑指offer上的原题。有需要的小伙伴可以关注下哈。leetcode1
Stella981 Stella981
4年前
2021金三银四想进字节大厂必看:LeetCode算法收割机+算法刷题宝典
最近有看到很多朋友想进大厂,四面竟然都考了算法,很多同学面对算法的问题都很头大,因为自己做项目很难用到,但是但凡高薪的职位面试都会问到。最近我整理了一份刷题宝典,这份刷题宝典,也让我进了心仪的大厂。今天给大家分享一下:!(https://static001.geekbang.org/infoq/07/074b4c3d563eca9e7f73a
可莉 可莉
4年前
2021金三银四想进字节大厂必看:LeetCode算法收割机+算法刷题宝典
最近有看到很多朋友想进大厂,四面竟然都考了算法,很多同学面对算法的问题都很头大,因为自己做项目很难用到,但是但凡高薪的职位面试都会问到。最近我整理了一份刷题宝典,这份刷题宝典,也让我进了心仪的大厂。今天给大家分享一下:!(https://static001.geekbang.org/infoq/07/074b4c3d563eca9e7f73a
Wesley13 Wesley13
4年前
LeetCode刷题实战61:旋转链表
算法的重要性,我就不多说了吧,想去大厂,就必须要经过基础知识和业务逻辑面试算法面试。所以,为了提高大家的算法能力,这个公众号后续每天带大家做一道算法题,题目就从LeetCode上面选!今天和大家聊的问题叫做旋转链表,我们先来看题面:https://leetcodecn.com/problems/rotatelist/Give
Python进阶者 Python进阶者
2年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这
贾蔷 贾蔷
8个月前
力扣1137题 解题思路和步骤 C++代码实现,力扣一共多少题
一、题目分析力扣1137题要求我们找到第N个泰波那契数。泰波那契数的定义是:T00,T11,T21,且在n0的条件下Tn3TnTn1Tn2。,当n4时,T4T3T2T14。这道题主要考查我们对递归或动态规划的理解和运用。在思考解题方法时,我们