锁定老帖子 主题:递归计算向非递归计算转换模板
该帖已经被评为精华帖
|
|
---|---|
作者 | 正文 |
发表时间:2008-06-07
最近由于工作上的需要,研究了一下递归计算向非递归计算的转换问题。理论上而言,所有递归程序都可以用非递归程序来实现;这种理论的基础是递归程序的计算总能用一颗树型结构来表示。递归计算从求树根节点的值开始,树根节点的值依赖一个或多个子节点的值,子节点的值又依赖下一级子节点的值,如此直至树的叶子节点。叶子节点的值能直接计算出来,也就是递归程序的出口。如下图所示,是递归函数f(x) = f(x-1) + f(x-3), f(x) = 10 (x < 3)当x=4时的递归调用树。简单的递归计算,比如尾部递归,可以直接用循环来转换成非递归;对于复杂的递归,比如递归程序中递归调用点有多个,就是树型结构中一个父节点的值会依赖多个子节点的值,这种情形的递归转换成非递归通常需要借助堆栈加循环的方式。
直接用编程语言中的递归函数实现递归时,在时间和空间上都有可能造成浪费。从时间上来讲,如果递归调用点有多个,会由于中间计算结果没有被保存重用而导致大量的重复计算。比如递归函数f(x) = f(x-1) + f(x-3),计算f(x)时,会先计算f(x-1)的值,在计算f(x-1)时会计算出许多子节点的值,这些值在计算f(x-3)时是可以重用的,但是当退出f(x-1)的调用后都被丢弃了,导致在计算f(x-3)时会重复很多计算。空间上,由于每次递归调用都要保留现场,递归变深时,树会迅速膨胀,占用的空间也会激增。
递归程序转换成非递归程序时有固定的模式可循,将这个模式抽象成通用的模板,就有可能实现递归至非递归程序的自动转换。根据前面的分析,将递归计算用树型结构来表达,计算父节点时,会要求计算出其子节点的值。如果用一个堆栈来表示,则计算父节点时,会先将该父节点压入堆栈,待到其依赖的所有子节点的值都计算出时,再将其弹出并计算其值;在计算其子节点时依照相同的原理,直至遇到叶子节点。考虑递归函数f(x) = f(x-1) + f(x-3), f(x) = 10 (x < 3), x 的初始值为4,用如图所示的数据结构表示,往pre方向是堆栈的底部,往next的方向是堆栈的顶部,堆栈指针指向当前正在计算的节点。计算第一个子节点的堆栈情况如下所示:
计算f(4)时会先计算f(3),计算f(3)时会先计算f(2),f(2)=10,是叶子节点,那么f(3)的第一个子节点f(2)计算完成,开始计算f(3)的第二个节点f(0):
f(0)=10,至此f(3)的两个子节点都计算完成,可以求出f(3) = f(2) +f(0) = 20。f(3)求出后,相当于f(4)的第一个子节点被计算出来了,开始计算f(4)的第二个子节点的值f(1):
f(1)=10,那么f(4)的两个子节点都已经被计算出来了,可以直接求f(4) = f(3) + f(1) = 30。由于此时已到堆栈底部,计算完成,弹出f(4)的计算结果,即为最终结果。
以上的示例虽然简单,但足以总结出如下规律: 结算某个节点的值时,有两种情况:
最后一条很关键,当每个节点完成计算时,它甚至没有信息可以判断前面哪个节点是其父节点!子节点没有父节点的信息,但父节点通过设置状态可以记录当前是在计算哪个子节点。对于特定的递归程序,每个父节点依赖的子节点的数目是确定的,就是递归调用点的数目;比如f(x) = f(x-1) + f(x-3),递归调用点为2,可以确定每个父节点依赖2个子节点。
基于前面如图所示的堆栈结构,计算父节点时会依次计算其子节点,其子节点会依次紧跟在父节点之后压入堆栈。设每个节点的初始状态为0,计算完成后状态为3;则刚进入递归时树根节点的状态为0,此时把该节点当作父节点,开始计算其第一个子节点,父节点的状态设置成1,表示在计算它的第一个子节点。第一个子节点计算完成后,自身状态为3,回溯检查,发现前面的节点状态为1,可以确定其为父节点,并且仅计算出了第一个子节点的值,还需要计算第二个子节点的值。这时将该父节点的状态设置成2,表示在计算它的第二个子节点。第二个子节点计算完成自身状态变为3后,回溯检查,至第一个子节点,第一个子节点状态为3,再回溯,至状态为2的父节点,由于该父节点总共只有两个依赖的子节点,所以可以断定该父节点的最后一个子节点已经完成了计算,可以计算该父节点的值了。根据前面的数据结构可知该父节点的两个子节点依次紧跟其后,可以直接依次取出计算父节点的值。当该父节点完成计算后,状态变为3,这个时候就该回溯去寻找该父节点的父节点了。当最后一个父节点找到并完成计算后,递归计算就完成了。如上所示的堆栈中保存的是递归参数的值,在实际程序中,我们还需要空间来保存递归参数对应的计算出来的值,一般一个HashMap就足够了。
经过上面的分析,应该能很容易地将例子中的递归程序转换成非递归程序。今天有点累了,明天会附上用java实现的非递归程序。我们可以清楚的从代码中看出既定的规律,进而归纳出一个通用的递归向非递归程序转换的模板。
声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|
返回顶楼 | |
发表时间:2008-06-07
有点意思 stay tune for next scene...
|
|
返回顶楼 | |
发表时间:2008-06-12
问题是,用非递归实现的算法在时间和空间上不一定比递归好。递归调用的运行时堆栈来保存每次递归前的信息,理论上用人工控制的一个栈加上一些代码就能实现递归算法。
|
|
返回顶楼 | |
发表时间:2008-06-15
回楼上,你怎么知道“用非递归实现的算法在时间和空间上不一定比递归好”?
递归算法如果用汇编的看法来看,就是不断地进行中断、保存现场、跳转,直到依次回调,恢复现场。这中间消耗大量CPU和内存(主要是堆栈)资源,而且代码效率不一定很高,而转为非递归,虽然代码量上去了,但是由于采用了简单的逻辑,运算效率要高 |
|
返回顶楼 | |
发表时间:2008-08-01
lindily 写道 回楼上,你怎么知道“用非递归实现的算法在时间和空间上不一定比递归好”?
递归算法如果用汇编的看法来看,就是不断地进行中断、保存现场、跳转,直到依次回调,恢复现场。这中间消耗大量CPU和内存(主要是堆栈)资源,而且代码效率不一定很高,而转为非递归,虽然代码量上去了,但是由于采用了简单的逻辑,运算效率要高 递归用不着中断,保存现场是因为寄存器不够用 自己用代码实现栈,同样涉及到数据访问的调度,寄存器一样不够用,也要“保存”、“恢复” cpu提供的栈操作效率一般都比自己用代码实现的栈来得高 所以,通常只在进程(或线程)申请的栈区不够用时,才自己在堆上实现栈 递归转非递归一般的目的是,减少计算复杂度,例如如消除重复计算 你的这个f(x),x=6时,f(6)f(5)f(4)f(1)各计算一次,f(3)计算两次,f(2)计算三次,f(0)计算两次,这里有很多重复的调用 如果仍用递归,一种优化方式是:先创建一个整数数组s,长度和x+1相同,初始0 if x<3 then f(x)=10 else if s[x]>0 then f(x)=s[x] else f(x)=s[x]=f(x-1)+f(x-3) 这样每个x都只会计算一次,计算复杂度由O(2的x方)降到O(x) 对于很大的x值,能极大地提高效率 这个方法的关键一点就是函数必须是幂等的 而许多递归并非这样,比如图论中的一些操作,需要修改节点做些标记,这样的函数就不能直接使用这个方法 进一步优化,就可以改成递推,同样有个数组s,然后从小往大的逐个计算: s[0]=s[1]=s[2]=10 for (y from 3 to x) s[y] = s[y-1] + s[y-3] 最后s[x]就是f(x) 这样时间复杂度仍然是O(x),但系数比上面的优化小一点,效率也高一点 (如果再做进一步优化,这个数组只要放3个数就够了,空间复杂度也优化成O(1)常量) 这个递推和原始的那个递归相比,实现的思路很不同 对于各种递归,因为存在非幂等的函数,没有单一的规律来做这样的 能优化时间复杂度的 转换 而对于大量重复的幂等计算,直接在函数里判断并保存计算过的值,也不需要特意把递归改成递推,这也是缓存的一般做法,比自己用代码实现栈,然后缓存值,更简单实用 |
|
返回顶楼 | |
发表时间:2008-08-06
lindily 写道 递归转非递归一般的目的是,减少计算复杂度,例如如消除重复计算 你的这个f(x),x=6时,f(6)f(5)f(4)f(1)各计算一次,f(3)计算两次,f(2)计算三次,f(0)计算两次,这里有很多重复的调用 |
|
返回顶楼 | |
发表时间:2009-03-03
mingliangfeng 写道
最近由于工作上的需要,研究了一下递归计算向非递归计算的转换问题。理论上而言,所有递归程序都可以用非递归程序来实现;这种理论的基础是递归程序的计算总能用一颗树型结构来表示。递归计算从求树根节点的值开始,树根节点的值依赖一个或多个子节点的值,子节点的值又依赖下一级子节点的值,如此直至树的叶子节点。叶子节点的值能直接计算出来,也就是递归程序的出口。如下图所示,是递归函数f(x) = f(x-1) + f(x-3), f(x) = 10 (x < 3)当x=4时的递归调用树。简单的递归计算,比如尾部递归,可以直接用循环来转换成非递归;对于复杂的递归,比如递归程序中递归调用点有多个,就是树型结构中一个父节点的值会依赖多个子节点的值,这种情形的递归转换成非递归通常需要借助堆栈加循环的方式。
直接用编程语言中的递归函数实现递归时,在时间和空间上都有可能造成浪费。从时间上来讲,如果递归调用点有多个,会由于中间计算结果没有被保存重用而导致大量的重复计算。比如递归函数f(x) = f(x-1) + f(x-3),计算f(x)时,会先计算f(x-1)的值,在计算f(x-1)时会计算出许多子节点的值,这些值在计算f(x-3)时是可以重用的,但是当退出f(x-1)的调用后都被丢弃了,导致在计算f(x-3)时会重复很多计算。空间上,由于每次递归调用都要保留现场,递归变深时,树会迅速膨胀,占用的空间也会激增。
递归程序转换成非递归程序时有固定的模式可循,将这个模式抽象成通用的模板,就有可能实现递归至非递归程序的自动转换。根据前面的分析,将递归计算用树型结构来表达,计算父节点时,会要求计算出其子节点的值。如果用一个堆栈来表示,则计算父节点时,会先将该父节点压入堆栈,待到其依赖的所有子节点的值都计算出时,再将其弹出并计算其值;在计算其子节点时依照相同的原理,直至遇到叶子节点。考虑递归函数f(x) = f(x-1) + f(x-3), f(x) = 10 (x < 3), x 的初始值为4,用如图所示的数据结构表示,往pre方向是堆栈的底部,往next的方向是堆栈的顶部,堆栈指针指向当前正在计算的节点。计算第一个子节点的堆栈情况如下所示:
计算f(4)时会先计算f(3),计算f(3)时会先计算f(2),f(2)=10,是叶子节点,那么f(3)的第一个子节点f(2)计算完成,开始计算f(3)的第二个节点f(0):
f(0)=10,至此f(3)的两个子节点都计算完成,可以求出f(3) = f(2) +f(0) = 20。f(3)求出后,相当于f(4)的第一个子节点被计算出来了,开始计算f(4)的第二个子节点的值f(1):
f(1)=10,那么f(4)的两个子节点都已经被计算出来了,可以直接求f(4) = f(3) + f(1) = 30。由于此时已到堆栈底部,计算完成,弹出f(4)的计算结果,即为最终结果。
以上的示例虽然简单,但足以总结出如下规律: 结算某个节点的值时,有两种情况:
最后一条很关键,当每个节点完成计算时,它甚至没有信息可以判断前面哪个节点是其父节点!子节点没有父节点的信息,但父节点通过设置状态可以记录当前是在计算哪个子节点。对于特定的递归程序,每个父节点依赖的子节点的数目是确定的,就是递归调用点的数目;比如f(x) = f(x-1) + f(x-3),递归调用点为2,可以确定每个父节点依赖2个子节点。
基于前面如图所示的堆栈结构,计算父节点时会依次计算其子节点,其子节点会依次紧跟在父节点之后压入堆栈。设每个节点的初始状态为0,计算完成后状态为3;则刚进入递归时树根节点的状态为0,此时把该节点当作父节点,开始计算其第一个子节点,父节点的状态设置成1,表示在计算它的第一个子节点。第一个子节点计算完成后,自身状态为3,回溯检查,发现前面的节点状态为1,可以确定其为父节点,并且仅计算出了第一个子节点的值,还需要计算第二个子节点的值。这时将该父节点的状态设置成2,表示在计算它的第二个子节点。第二个子节点计算完成自身状态变为3后,回溯检查,至第一个子节点,第一个子节点状态为3,再回溯,至状态为2的父节点,由于该父节点总共只有两个依赖的子节点,所以可以断定该父节点的最后一个子节点已经完成了计算,可以计算该父节点的值了。根据前面的数据结构可知该父节点的两个子节点依次紧跟其后,可以直接依次取出计算父节点的值。当该父节点完成计算后,状态变为3,这个时候就该回溯去寻找该父节点的父节点了。当最后一个父节点找到并完成计算后,递归计算就完成了。如上所示的堆栈中保存的是递归参数的值,在实际程序中,我们还需要空间来保存递归参数对应的计算出来的值,一般一个HashMap就足够了。
经过上面的分析,应该能很容易地将例子中的递归程序转换成非递归程序。今天有点累了,明天会附上用java实现的非递归程序。我们可以清楚的从代码中看出既定的规律,进而归纳出一个通用的递归向非递归程序转换的模板。
|
|
返回顶楼 | |
发表时间:2009-03-03
可惜啊,lz,尾递归在很早很早的时候就可以解析成迭代了
而且递归有一个好处——很容易修改成并行计算 |
|
返回顶楼 | |
发表时间:2009-03-03
除了 tail recursive 那种。其它类型的recursive改写都需要 手动 操作stack。貌似价值不大。写出来的程序也未必可读性很好。
|
|
返回顶楼 | |
发表时间:2009-03-04
递归有在简单的情况下, 是无可替代的。
不知道在大家有见过栈溢出的问题么, 如果一个太深递归, 会导致栈溢出, 线程栈虽然可以定义大小, 但是, 一个超过500线程的系统, 栈会消耗的太多的内存, 导致性能下降, 这个对JAVA有兴趣的朋友可以测试下, -Xss256k -Xss1024k 这样的性能差别。 如果对应用的可靠性要求很高,递归又很深度, 递归转非递归是程序员必要的技能。 任何东西都有他的适用价值, 纯粹的价值意义不大。 自己实现转非递归最简单办法就是实现自己的栈。 因为递归执行就是在栈上完成的。把握了这个, 就不难了。 当然特定的问题还有特定解决办法。 比如循环等操作。 |
|
返回顶楼 | |