`
darkbaby123
  • 浏览: 104090 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

使用栈和后缀表达式解析算术表达式

阅读更多

最近补习数据结构(谁叫我不是科班出身呢),看了栈的应用之一,做算术表达式解析计算,但那个例子中没有把括号的逻辑加进去,苦想一段时间后还是没有结果,于是Google出一些表达式解析的方案,觉得用后缀表达式解析是最方便的,遂用Ruby实现了一个,支持由数字、加减乘除和括号组成的表达式,因为主要目的是对栈的应用,所以一些地方能简则简。

class MyParser
  PRECEDENCE = [
    ['(', ')'],
    ['|'],
    ['&'],
    ['+', '-'],
    ['*', '/']
  ]
  
  REG_VARIABLE = /\d+(?:\.\d+)?/
  REG_OPERATOR = /[\+\-\*\/\|\&]/
  REG_PARENTHESIS = /[\(\)]/
  REG_SPACE = /\s+/
  
  def self.exec(exp)
    exec_postfix parse_to_postfix(exp)
  end
  
  # 将表达式解析成后缀表达式,这里后缀表达式改用数组
  def self.parse_to_postfix(exp)
    postfix_exp, stack = [], []
    # 每次从exp中取出第一段标志符(数字,操作符,括号),进行分析,exp中的标志符取完后退出循环
    until exp.nil? or exp.size == 0
      case exp
      when /^(#{REG_VARIABLE})/ # 数字
        token = $1
        postfix_exp << token
      when /^(#{REG_OPERATOR})/ # 操作符
        token = $1
        # 这个if和else可以合在一起的,但我觉得这样逻辑更清晰,脑袋笨了冒得法啊
        if stack.empty?
          stack << token
        else
          # 原来这里的逻辑错了,现已改正
          # 当读取的操作符优先级不高于栈中的操作符优先级时,需要依次将栈中的操作符弹出送到表达式中
          while stack.size > 0 && precedence(token) <= precedence(stack.last)
            postfix_exp << stack.pop
          end
          stack << token
        end
      when /^(#{REG_PARENTHESIS})/ # 括号
        token = $1
        case token
        when '('
          stack << token
        when ')'
          postfix_exp << stack.pop while !stack.empty? && stack.last != '('
          # 因为一般')'都会有匹配的'(',正常情况下这里stack的最后一个元素一定是'('
          raise "mismatched parenthesis '#{token}'" if stack.last != '('
          stack.pop
        else
          raise "parenthesis '#{token}' wrong"
        end
      when /^(#{REG_SPACE})/ # 空格,这个只是额外处理,和表达式转换的核心逻辑无关
        token = $1
      else
        raise "unknown token! expression is '#{exp}'"
      end
      exp = exp[token.size..-1]
    end

    until stack.empty?
      # 检查括号是否匹配的,因为stack中只会压入'(',不会压入')'
      # 如果表达式括号匹配的话,到这里stack中所有的'('应该都已经被处理了
      raise "mismatched parenthesis '('" if stack.last == '('
      postfix_exp << stack.pop
    end
    postfix_exp
  end
  
  # 根据后缀表达式计算结果
  def self.exec_postfix(postfix_exp)
    stack = []
    postfix_exp.each do |token|
      case token
      when REG_VARIABLE # 变量直接压入stack
        stack << token.to_f
      when REG_OPERATOR # 碰到操作符,从stack中弹出两个数,进行计算,再将结果压入
        raise 'stack size < 2'if stack.size < 2
        d2, d1 = stack.pop, stack.pop
        stack << exec_exp(d1, token, d2)
      end
    end
    raise 'final stack size must be 1' if stack.size != 1
    stack.first
  end
  
  # 计算操作符的优先级,返回一个数字,数字越大优先级越高
  def self.precedence(op)
    re = PRECEDENCE.index { |group| group.include?(op) }
    raise "unknown operator '#{op}'" if re.nil?
    re
  end
  
  # 输入两个数和二元运算符,进行计算,返回结果
  # 例:exec_exp(1, '+', 2)  =>  3
  def self.exec_exp(d1, op, d2)
    case op
    when REG_OPERATOR
      d1.send(op, d2)
    else
      raise "operator '#{op}' wrong"
    end
  end
end

# 测试一下,看算的对不对
puts 'TEST CALCULATE'
[
  ['1+2*3', 7.0], # 前面是表达式,后面是期望的计算结果,下同
  ['1*2-3', -1.0],
  ['10-(4-2)*3', 4.0],
  ['2*(24-(3*10))+11', -1.0]
].each do |exp, result|
  puts exp
  postfix_exp = MyParser.parse_to_postfix(exp)
  puts "  #{'parse'.ljust(9)} = #{postfix_exp}"
  puts "  #{'calc'.ljust(9)} = #{MyParser.exec_postfix postfix_exp}"
  puts "  #{'expect'.ljust(9)} = #{result}"
end

# 测试后缀表达式是否正确
puts 'TEST POSTFIX EXPRESSION'
[
  ['1|2&3+4|5', '1234+&|5|'],
  ['1-2|3*4&5', '12-34*5&|'],
  ['(1|2)&3+(4|5)', '12|345|+&']
].each do |exp, result|
  puts exp
  postfix_exp = MyParser.parse_to_postfix(exp).join
  puts "  #{'parse'.ljust(9)} = #{postfix_exp}"
  puts "  #{'expect'.ljust(9)} = #{result}"
end

运行 结果如下:

1+2*3
  parse     = ["1", "2", "3", "*", "+"]
  calc      = 7.0
  expect    = 7.0
1*2-3
  parse     = ["1", "2", "*", "3", "-"]
  calc      = -1.0
  expect    = -1.0
10-(4-2)*3
  parse     = ["10", "4", "2", "-", "3", "*", "-"]
  calc      = 4.0
  expect    = 4.0
2*(24-(3*10))+11
  parse     = ["2", "24", "3", "10", "*", "-", "*", "11", "+"]
  calc      = -1.0
  expect    = -1.0

 嗯,至少没算错……

下面说说大概思路:

基本逻辑就是两步,先把输入的表达式(我们一般的表达式写法都是中缀表达式)转换成后缀表达式,然后用后缀表达式进行计算。比如这样:

# 中缀表达式,我们通常写的形式
1*2+3
# 这是后缀表达式的写法,基本上是把运算符放到数字后面,
# 读法为从前往后读,碰到运算符,就把运算符前的两个数字代入计算,计算结果就取代了原来的两个数字和运算符,以此类推
12*3+
# 再看个复杂点的,中缀表达式如下
1+2*3
# 后缀表达式,
123*+
# 这个是有括号的中缀表达式
(1+2)*3
# 换成后缀表达式就是这样,可以看出,后缀表达式是没有括号和运算符优先级的,比较方便由计算机处理
这正是要转换成后缀表达式的原因
12+3*

后缀表达式很容易被计算机处理,逻辑也不复杂。

其实数据结构教程里的示例代码的原理和上面的Ruby代码十分类似,只是一个直接计算,一个是转换成后缀表达式。

个人感觉数据结构的示例,把对栈的操作和数据计算混在一起,比较乱。而且要处理括号的逻辑,可能要采用递归才能实现,比较麻烦。

 

参考资料

 

这篇文章是思路来源,我用Ruby重新实现了一把,补充一些细节,里面讲表达式转换逻辑和后缀表达式计算逻辑比较详细

利用堆栈解析算术表达式

这篇是我原来比较倾向的思路,完全采用递归,将表达式不停拆分解析,直到最基本的元素,可惜代码太长,比较复杂,懒得看了

解析表达式--Java编程艺术

这是RednaxelaFX 童鞋补充的资料,Wikipedia上表达式转换的文章,感叹一句:砖业人士啊

Shunting-yard algorithm

分享到:
评论
8 楼 yourfei 2010-02-02  
我大学的时候做编译原理课程设计就是做的这个,当时还得了个优!
当时是用C++做的,MFC做的界面,输出有逆波兰式、三元式、四元式、树形结构和计算结果。树形结构式用MFC的Tree控件做的。现在想想当时挑灯夜战写的代码就感慨万千!
7 楼 linliangyi2007 2010-01-31  
楼主有兴趣可以参考这个东东
http://linliangyi2007.iteye.com/blog/337069
一起讨论啊
6 楼 darkbaby123 2010-01-28  
都改正了,这样确实严谨些,原来偷懒都没判断括号匹配的。
5 楼 RednaxelaFX 2010-01-26  
darkbaby123 写道
RednaxelaFX 写道
good,楼主一下就发现问题所在了 ^_^
还有些小地方可能要注意的,例如让顶楼的程序去执行表达式")"的话……跟核心算法没直接关系,只是边界条件要检查一下而已。
另外就是想提一下这个解析算法叫作shunting-yard algorithm,以后查资料的话用这个关键字会比较容易找到。

嗯,受教了。不过你说的“边界条件检查”该如何实现呢?不是很明白怎么把括号和算法逻辑分开。

参考Wikipedia上给出的算法描述吧。注意这段:
引用
If the token is a right parenthesis:
- Until the token at the top of the stack is a left parenthesis, pop operators off the stack onto the output queue.
- Pop the left parenthesis from the stack, but not onto the output queue.
- If the token at the top of the stack is a function token, pop it onto the output queue.
- If the stack runs out without finding a left parenthesis, then there are mismatched parentheses.

对应到顶楼的代码,至少应该做这样的修改:
parse_to_postfix的循环中
when /^(#{REG_PARENTHESIS})/ # 括号
  token = $1
  case token
  when '('
    stack << token
  when ')'
    postfix_exp << stack.pop while !stack.empty? && stack.last != '('
    raise "mismatched parenthesis '#{token}'" if stack.last != '('
    stack.pop
  end

循环结束后临返回前的那组pop:
until stack.empty?
  raise "mismatched parenthesis '('" if stack.last == '('
  postfix_exp << stack.pop
end

这样括号不匹配的问题就会减轻些……
4 楼 darkbaby123 2010-01-26  
RednaxelaFX 写道
good,楼主一下就发现问题所在了 ^_^
还有些小地方可能要注意的,例如让顶楼的程序去执行表达式")"的话……跟核心算法没直接关系,只是边界条件要检查一下而已。
另外就是想提一下这个解析算法叫作shunting-yard algorithm,以后查资料的话用这个关键字会比较容易找到。

嗯,受教了。不过你说的“边界条件检查”该如何实现呢?不是很明白怎么把括号和算法逻辑分开。
3 楼 RednaxelaFX 2010-01-26  
good,楼主一下就发现问题所在了 ^_^
还有些小地方可能要注意的,例如让顶楼的程序去执行表达式")"的话……跟核心算法没直接关系,只是边界条件要检查一下而已。
另外就是想提一下这个解析算法叫作shunting-yard algorithm,以后查资料的话用这个关键字会比较容易找到。
2 楼 darkbaby123 2010-01-26  
后缀表达式的解析确实有问题,原来居然没注意到
主要是对操作符的判断这一块,应该改成循环判断的
when /^(#{REG_OPERATOR})/ # 操作符
        token = $1
        if stack.empty?
          stack << token
        else
          while stack.size > 0 && precedence(token) <= precedence(stack.last)
            postfix_exp << stack.pop
          end
          stack << token
        end

BTW:优先级的英文错误也改了,英语实在不好……以后要努力了
1 楼 RednaxelaFX 2010-01-26  
well...因为楼主参考的文章就的算法就有瑕疵,所以楼主搬过来的时候也有一样的问题。
顶楼的文章要解析的表达式只有2个有效优先级(顺带,运算符优先级是用precedence表示的),加减是一个,乘除是一个,括号因为在解析的时候被特别处理所以不算。在这个条件下,某部分代码是没问题的。但如果有效优先级增加到2个以上,例如说
class MyParser
  PRIORITY = [
    ['(', ')'],
    ['|'],
    ['&'],
    ['+', '-'],
    ['*', '/']
  ]

# ...
end

其中&与|分别表示按位与和按位或,前者优先级比后者高,两者都比加法优先级低。那么顶楼代码中某个入栈/出栈操作就会出问题了。楼主自己试试去发现这个问题吧?

举例:表达式
1 | 2 & 3 + 4 | 5

应该转换为这样的后缀表达式:
['1', '2', '3', '4', '+', '&', '|', '5', '|']

而顶楼的代码照现在的逻辑会将其变为:
['1', '2', '3', '4', '+', '5', '|', '&', '|']

(这个表达式照现在顶楼代码的写法求不了值这是另外一回事了,跟解析方式没关系)

相关推荐

    自定义栈中缀表达式转换为后缀表达式并求值

    此案例主要涉及到了三种自定义类的设计:`stack`用于管理运算符的顺序和优先级,`Middle_expressionToPost_expression`负责中缀表达式到后缀表达式的转换,而`Post_expression_value`则用于解析后缀表达式并计算其...

    算术表达式(利用后缀表达式)

    在计算机科学中,算术表达式的处理是一项基本任务,它涉及到计算、解析和评估复杂的数学公式。本主题主要关注一种高效的方法,即利用后缀表达式(也称为逆波兰表示法)来解决这一问题。后缀表达式是解决算术表达式求...

    算术表达式翻译成对应的后缀表达式

    本项目是一个基于Yacc(Yet Another Compiler-Compiler)的程序,用于将用户输入的中缀算术表达式转化为等价的后缀表达式,也被称为逆波兰表示法。Yacc是一种自顶向下、递归下降的解析器生成器,通常与词法分析器...

    前缀表达式、中缀表达式和后缀表达式 - 乘月归 - 博客园.pdf

    前缀表达式、中缀表达式和后缀表达式是编程中常见的三种表达式表示方法,它们在计算机程序设计和算法中扮演着重要的角色。中缀表达式是最常见的一种,例如在普通的算术运算中就广泛使用。而后缀表达式和前缀表达式则...

    利用栈进行算术表达式运算的c++代码

    ### 利用栈进行算术表达式运算的C++代码解析 #### 一、背景介绍 在计算机科学中,表达式的求值是一个重要的基础问题。本篇内容将深入探讨如何利用栈这一数据结构来实现算术表达式的计算,并具体分析了一个示例程序...

    利用栈进行算术表达式的运算

    本文介绍了一种基于栈的算术表达式求值方法,通过构建两个栈(一个用于存储运算符,一个用于存储数字)来实现对算术表达式的解析和计算。这种方法不仅能够有效地处理包含括号的复杂表达式,而且具有较好的可扩展性和...

    STL-后缀表达式的计算

    3. **转换为后缀表达式**:函数`inTOpost`接收一个字符串作为输入,使用栈将其中的标准数学表达式转换为后缀表达式。 4. **计算后缀表达式的值**:函数`compute`接收一个表示后缀表达式的`vector&lt;char&gt;`类型参数,...

    后缀表达式计算器

    1. **表达式解析**:输入的后缀表达式需要被解析成一个个单独的数字和运算符。这通常通过分隔符(如空格)来完成。解析过程中,可以使用字符串的切片或正则表达式来提取每个元素。 2. **栈数据结构**:栈是后缀...

    中缀表达式变后缀表达式的求值

    然而,在计算机处理时,后缀表达式(也称为逆波兰表示法)更易于计算,因为它消除了括号的需求并利用栈来解析运算顺序。后缀表达式将操作符放在它们的操作数之后,例如,上述中缀表达式在后缀表示法中为 \(2 3 4 \...

    后缀表达式计算

    1. **输入解析**:将给定的后缀表达式按照空格或特定分隔符拆分成一个个符号(数字和运算符)。 2. **创建数据结构**:创建一个栈,用于存储操作数和中间结果。栈是一种“后进先出”(LIFO)的数据结构,非常适合...

    算术表达式中缀转后缀并计算结果

    4. 得到的后缀表达式可以直接用栈计算其结果,因为每个运算符后面都有它的两个操作数。 后缀表达式的计算过程简单直接: 1. 将后缀表达式的每个操作数依次压入栈中。 2. 当遇到运算符时,弹出栈顶的两个操作数进行...

    后缀表达式的实现

    后缀表达式,又称逆波兰表示法,是数学和计算机科学中用于表示算术表达式的一种方式。在后缀表达式中,运算符放在它们的操作数之后,这与我们常用的中缀表达式(运算符在操作数之间)不同。这种表示法在计算和解析...

    中缀后缀表达式

    与前缀表达式(例:+ 3 4)或后缀表达式(例:3 4 +)相比,中缀表达式不容易被计算机解析,但仍被许多程序语言使用,因为它符合人们的普遍用法。 与前缀或后缀记法不同的是,中缀记法中括号是必需的。计算过程中...

    算术表达式解析模板代码 逆波兰

    在解析算术表达式时,通常采用两种主要方法:中缀表达式转换为后缀表达式(逆波兰表示法),以及直接解析后缀表达式。前者涉及将中缀表达式通过操作符优先级规则转换,后者则利用栈来依次处理后缀表达式中的元素。 ...

    逆波兰算术表达式解析的JavaScript实现

    本篇文章将探讨如何使用JavaScript来实现逆波兰算术表达式解析器。 在逆波兰表示法中,一个表达式如 "2 + 3 * 4" 将被转化为 "2 3 4 *"。解释器按照后进先出(LIFO)的原则,即栈的数据结构,来处理这些元素。...

    用数组实现后缀表达式的算法

    根据给定的信息,本文将详细解释如何在C语言中利用数组来实现后缀...此外,还定义了一系列函数来管理栈的操作以及解析和计算后缀表达式。通过这种方式,该算法能够有效地处理各种后缀表达式,并返回正确的计算结果。

    基于栈结构的中缀表达式求值实验报告

    在处理这类表达式时,我们通常需要将其转换或直接解析为后缀表达式(也称为逆波兰表示法),因为后缀表达式更适合于简单的栈操作进行求值。然而,通过巧妙地利用栈结构,我们也可以直接对中缀表达式进行求值。本文将...

    简单实用的表达式解析器

    在解析表达式时,栈经常用于存储运算符和操作数,尤其是当处理中缀表达式到后缀表达式(逆波兰表示法)的转换时。栈的特性——后进先出(LIFO)——使得它非常适合处理运算符的计算顺序。 `ParseException.java` ...

    中缀表达式到后缀表达式的转换,后缀表达式求值(逆波兰表示法)vc

    转换从中缀表达式到后缀表达式的过程主要基于两个栈:一个操作数栈和一个运算符栈。以下是转换的基本步骤: 1. 从左到右扫描中缀表达式。 2. 如果遇到操作数,将其压入操作数栈。 3. 如果遇到运算符,比较其优先级...

    后缀表达式

    后缀表达式,又称逆波兰表示法,是数学和计算机科学中的一种算法,用于表示算术表达式。这种表示方式不使用括号,而是通过将运算符放置在操作数之后来消除运算优先级的歧义。它使得计算过程更为简单,因为只需要一个...

Global site tag (gtag.js) - Google Analytics