表达式求值相关算法

太上老君
• 阅读 2322

实现对一个数学表达式的求值,例如:1+2*(3+4) 这个表达式的值为 15

这个问题主要要分为如下几个步骤:

  1. 语法分析: 将字符串表达式转化为数字和操作符的 token 数组,['1', '+', '2', '*', '(', '3', '+', '4', ')']
  2. 转逆波兰表达式: 将中缀表达式转后缀表达式,['1', '2', '3', '4', '+', '*', '+']
  3. 逆波兰表达式求值: 15

逆波兰表达式转二叉树: 条件表达式中,二叉树的求值能提前返回,能比逆波兰表达式计算量更少

语法分析

def tokenizer(expr):
    l = len(expr)
    i = 0
    tokens = []
    while i < l:
        while expr[i] == ' ':
            i += 1
        if is_operator(expr[i]):
            if i + 1 == l:
                return None
            if expr[i] == '-':
                if tokens and (not is_operator(tokens[-1]) and not tokens[-1] == '('):
                    tokens.append(expr[i])
                    i += 1
                else:
                    j = i + 1
                    while j < l and not is_operator(expr[j]) and not is_parenthesis(expr[j]):
                        j += 1
                    tokens.append(expr[i:j])
                    i = j
            else:
                tokens.append(expr[i])
                i += 1
        elif is_parenthesis(expr[i]):
            tokens.append(expr[i])
            i += 1
        else:
            j = i
            while j < l and not is_operator(expr[j]) and not is_parenthesis(expr[j]):
                j += 1
            tokens.append(expr[i:j])
            i = j

    return tokens

转逆波兰表达式

准备一个栈来存储运算符和 "("

遍历中缀表达式

  1. 如果是操作数,直接输出
  2. 如果是 "(",直接入栈
  3. 如果是 ")",从栈中弹出元素输出直到遇到 "("
  4. 如果是运算符并且栈为空,直接入栈
  5. 如果是运算符并且栈不为空,从栈里弹出元素输出,直到栈顶优先级低于当前运算符或者遇到 "("

将栈里剩余的元素一次弹出输出

op_priority = {
    '+': 1,
    '-': 1,
    '*': 2,
    '/': 2,
    '%': 2,
    '^': 3,
}

def to_polish(tokens):
    polish = []
    stack = []
    for token in tokens:
        if is_operator(token):
            while stack and is_operator(stack[-1]) and op_priority[stack[-1]] >= op_priority[token]:
                polish.append(stack[-1])
                stack.pop()
            stack.append(token)
        elif token == '(':
            stack.append(token)
        elif token == ')':
            while stack and stack[-1] != '(':
                polish.append(stack[-1])
                stack.pop()
            if not stack:
                return None
            stack.pop()
        else:
            polish.append(token)
    while stack:
        polish.append(stack[-1])
        stack.pop()

    return polish

逆波兰表达式求值

准备一个栈用来存储中间结果

遍历逆波兰表达式

  1. 如果是操作数,直接入栈
  2. 如果是运算符,从栈顶取出运算符所需要的操作数个数,计算结果再次入栈

最后栈中只剩下一个元素,即最终结果

op_handler = {
    '+': lambda x, y: x+y,
    '-': lambda x, y: x-y,
    '*': lambda x, y: x*y,
    '/': lambda x, y: x/y,
    '%': lambda x, y: x % y,
    '^': lambda x, y: x**y,
}

def calculate(polish):
    stack = []
    for token in polish:
        if is_operator(token):
            y = stack[-1]
            stack.pop()
            x = stack[-1]
            stack.pop()
            stack.append(op_handler[token](x, y))
        else:
            stack.append(int(token))
    return stack[-1]

逆波兰表达式转二叉树

准备一个栈用来存储中间节点

遍历逆波兰表达式

  1. 如果是操作数,构造一个操作数节点入栈
  2. 如果是运算符,构造一个新的节点,从栈顶取两个元素作为左右节点,新节点入栈

最后栈中只剩下一个节点,即最终的 root 节点

class Node:
    def __init__(self, val, left=None, right=None):
        self.left = left
        self.right = right
        self.val = val

    def __str__(self):
        return str(self.left) + ", " + str(self.val) + ", " + str(self.right)


def to_binary_tree(polish):
    stack = []
    for token in polish:
        if is_operator(token):
            right = stack[-1]
            stack.pop()
            left = stack[-1]
            stack.pop()
            stack.append(Node(token, left, right))
        else:
            stack.append(Node(token))
    return stack[-1]

二叉树求值

递归求值即可

def calculate_binary_tree(node):
    if not is_operator(node.val):
        return int(node.val)
    return op_handler[node.val](calculate_binary_tree(node.left), calculate_binary_tree(node.right))
转载请注明出处
本文链接:https://tech.hatlonely.com/article/67
点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Peter20 Peter20
4年前
mysql中like用法
like的通配符有两种%(百分号):代表零个、一个或者多个字符。\(下划线):代表一个数字或者字符。1\.name以"李"开头wherenamelike'李%'2\.name中包含"云",“云”可以在任何位置wherenamelike'%云%'3\.第二个和第三个字符是0的值wheresalarylike'\00%'4\
Wesley13 Wesley13
3年前
thinkphp3.2.3模板渲染支持三元表达式
thinkphp3.2.3模板渲染支持三元表达式{$status?'正常':'错误'}{$info'status'?$info'msg':$info'error'}注意:三元运算符中暂时不支持点语法。如下:           <divclass"modalhidefade"id'myModa
Wesley13 Wesley13
3年前
FLV文件格式
1.        FLV文件对齐方式FLV文件以大端对齐方式存放多字节整型。如存放数字无符号16位的数字300(0x012C),那么在FLV文件中存放的顺序是:|0x01|0x2C|。如果是无符号32位数字300(0x0000012C),那么在FLV文件中的存放顺序是:|0x00|0x00|0x00|0x01|0x2C。2.  
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
PHP创建多级树型结构
<!lang:php<?php$areaarray(array('id'1,'pid'0,'name''中国'),array('id'5,'pid'0,'name''美国'),array('id'2,'pid'1,'name''吉林'),array('id'4,'pid'2,'n
Wesley13 Wesley13
3年前
Java日期时间API系列36
  十二时辰,古代劳动人民把一昼夜划分成十二个时段,每一个时段叫一个时辰。二十四小时和十二时辰对照表:时辰时间24时制子时深夜11:00凌晨01:0023:0001:00丑时上午01:00上午03:0001:0003:00寅时上午03:00上午0
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
1年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这
美凌格栋栋酱 美凌格栋栋酱
5个月前
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(