- 浏览: 989526 次
- 性别:
- 来自: 广州
-
最新评论
-
qingchuwudi:
有用,非常感谢!
erlang进程的优先级 -
zfjdiamond:
你好 这条命令 在那里输入??
你们有yum 我有LuaRocks -
simsunny22:
这个是在linux下运行的吧,在window下怎么运行escr ...
escript的高级特性 -
mozhenghua:
http://www.erlang.org/doc/apps/ ...
mnesia 分布协调的几个细节 -
fxltsbl:
A new record of 108000 HTTP req ...
Haproxy 1.4-dev2: barrier of 100k HTTP req/s crossed
erlang的标准用法是尽可能的把函数调用写出尾递归的方式,实际的结果靠参数传递。尾递归的方式对进程的堆栈使用很小, 只要一个WORD, 但是非尾递归就要看递归的层数,如果数量很大,会把堆栈撑的很大。我们在汇编一级看下如何实现的:
root@nd-desktop:~# cat tailcall.erl
-module(tailcall).
-export([start/1]).
-compile(export_all).
start(N)->
X = loop(N),
Y = tail_loop(N),
X = Y,
done.
loop(0)->
1;
loop(N) when N >0 ->
N * loop(N-1).
tail_loop(N)->
tail_loop2(N, 1).
tail_loop2(0, R)->
R;
tail_loop2(N, R) ->
tail_loop2(N-1, N *R).
root@nd-desktop:~# erlc +"'S'" tailcall.erl
root@nd-desktop:~# cat tailcall.S
{module, tailcall}. %% version = 0
{exports, [{loop,1},
{module_info,0},
{module_info,1},
{start,1},
{tail_loop,1},
{tail_loop2,2}]}.
{attributes, []}.
{labels, 16}.
{function, start, 1, 2}.
{label,1}.
{func_info,{atom,tailcall},{atom,start},1}.
{label,2}.
{allocate,1,1}.
{move,{x,0},{y,0}}.
{call,1,{f,5}}.
{move,{x,0},{x,1}}.
{move,{y,0},{x,0}}.
{move,{x,1},{y,0}}.
{call,1,{f,8}}.
{test,is_eq_exact,{f,3},[{x,0},{y,0}]}.
{move,{atom,done},{x,0}}.
{deallocate,1}.
return.
{label,3}.
{badmatch,{x,0}}.
{function, loop, 1, 5}.
{label,4}.
{func_info,{atom,tailcall},{atom,loop},1}.
{label,5}.
{test,is_eq_exact,{f,6},[{x,0},{integer,0}]}.
{move,{integer,1},{x,0}}.
return.
{label,6}.
{test,is_lt,{f,4},[{integer,0},{x,0}]}.
{allocate_zero,1,1}.
%% 主要是这条 allocate_zero 这个指令 把当前的调用栈保存 同时分配个参数空间
%% 对应 AllocateZero 这个操作
{gc_bif,'-',{f,0},1,[{x,0},{integer,1}],{x,1}}.
{move,{x,0},{y,0}}.
{move,{x,1},{x,0}}.
{call,1,{f,5}}.
%% call opcode, 再次调用 堆栈层数+1
{gc_bif,'*',{f,0},1,[{y,0},{x,0}],{x,0}}.
{deallocate,1}.
%% 恢复调用栈
%% 对应 deallocate_I操作
return.
{function, tail_loop, 1, 8}.
{label,7}.
{func_info,{atom,tailcall},{atom,tail_loop},1}.
{label,8}.
{move,{integer,1},{x,1}}.
{call_only,2,{f,10}}.
{function, tail_loop2, 2, 10}.
{label,9}.
{func_info,{atom,tailcall},{atom,tail_loop2},2}.
{label,10}.
{test,is_eq_exact,{f,11},[{x,0},{integer,0}]}.
{move,{x,1},{x,0}}.
return.
{label,11}.
{gc_bif,'-',{f,0},2,[{x,0},{integer,1}],{x,2}}.
{gc_bif,'*',{f,0},3,[{x,0},{x,1}],{x,1}}.
{move,{x,2},{x,0}}.
{call_only,2,{f,10}}.
%% 调用 call_only opcode 没有建立堆栈的过程
{function, module_info, 0, 13}.
{label,12}.
{func_info,{atom,tailcall},{atom,module_info},0}.
{label,13}.
{move,{atom,tailcall},{x,0}}.
{call_ext_only,1,{extfunc,erlang,get_module_info,1}}.
{function, module_info, 1, 15}.
{label,14}.
{func_info,{atom,tailcall},{atom,module_info},1}.
{label,15}.
{move,{x,0},{x,1}}.
{move,{atom,tailcall},{x,0}}.
{call_ext_only,2,{extfunc,erlang,get_module_info,2}}.
我们在beam_emu.c中可以看到:
#define AllocateZero(Ns, Live) \
do { Eterm* ptr; \
int i = (Ns); \
AH(i, 0, Live); \
for (ptr = E + i; ptr > E; ptr--) { \
make_blank(*ptr); \
} \
} while (0)
#define AH(StackNeed, HeapNeed, M) \
do { \
int needed; \
needed = (StackNeed) + 1; \
if (E - HTOP < (needed + (HeapNeed))) { \
SWAPOUT; \
reg[0] = r(0); \
PROCESS_MAIN_CHK_LOCKS(c_p); \
FCALLS -= erts_garbage_collect(c_p, needed + (HeapNeed), reg, (M)); \
PROCESS_MAIN_CHK_LOCKS(c_p); \
r(0) = reg[0]; \
SWAPIN; \
} \
E -= needed; \
SAVE_CP(E); \
} while (0)
#define SAVE_CP(X) \
do { \
*(X) = make_cp(c_p->cp); \
c_p->cp = 0; \
} while(0)
#define RESTORE_CP(X) SET_CP(c_p, cp_val(*(X)))
#define D(N) \
RESTORE_CP(E); \
E += (N) + 1;
OpCase(deallocate_I): {
Eterm* next;
PreFetch(1, next);
D(Arg(0));
NextPF(1, next);
}
结论是:
尾递归的效率要比递归的好很多, 包括堆栈的使用和参数的分配,就是代码写起来不那么直观。
noway
并不是所有的递归都能转化成尾递归吧
good enough.
noway
root@nd-desktop:~# cat tailcall.erl
-module(tailcall).
-export([start/1]).
-compile(export_all).
start(N)->
X = loop(N),
Y = tail_loop(N),
X = Y,
done.
loop(0)->
1;
loop(N) when N >0 ->
N * loop(N-1).
tail_loop(N)->
tail_loop2(N, 1).
tail_loop2(0, R)->
R;
tail_loop2(N, R) ->
tail_loop2(N-1, N *R).
root@nd-desktop:~# erlc +"'S'" tailcall.erl
root@nd-desktop:~# cat tailcall.S
{module, tailcall}. %% version = 0
{exports, [{loop,1},
{module_info,0},
{module_info,1},
{start,1},
{tail_loop,1},
{tail_loop2,2}]}.
{attributes, []}.
{labels, 16}.
{function, start, 1, 2}.
{label,1}.
{func_info,{atom,tailcall},{atom,start},1}.
{label,2}.
{allocate,1,1}.
{move,{x,0},{y,0}}.
{call,1,{f,5}}.
{move,{x,0},{x,1}}.
{move,{y,0},{x,0}}.
{move,{x,1},{y,0}}.
{call,1,{f,8}}.
{test,is_eq_exact,{f,3},[{x,0},{y,0}]}.
{move,{atom,done},{x,0}}.
{deallocate,1}.
return.
{label,3}.
{badmatch,{x,0}}.
{function, loop, 1, 5}.
{label,4}.
{func_info,{atom,tailcall},{atom,loop},1}.
{label,5}.
{test,is_eq_exact,{f,6},[{x,0},{integer,0}]}.
{move,{integer,1},{x,0}}.
return.
{label,6}.
{test,is_lt,{f,4},[{integer,0},{x,0}]}.
{allocate_zero,1,1}.
%% 主要是这条 allocate_zero 这个指令 把当前的调用栈保存 同时分配个参数空间
%% 对应 AllocateZero 这个操作
{gc_bif,'-',{f,0},1,[{x,0},{integer,1}],{x,1}}.
{move,{x,0},{y,0}}.
{move,{x,1},{x,0}}.
{call,1,{f,5}}.
%% call opcode, 再次调用 堆栈层数+1
{gc_bif,'*',{f,0},1,[{y,0},{x,0}],{x,0}}.
{deallocate,1}.
%% 恢复调用栈
%% 对应 deallocate_I操作
return.
{function, tail_loop, 1, 8}.
{label,7}.
{func_info,{atom,tailcall},{atom,tail_loop},1}.
{label,8}.
{move,{integer,1},{x,1}}.
{call_only,2,{f,10}}.
{function, tail_loop2, 2, 10}.
{label,9}.
{func_info,{atom,tailcall},{atom,tail_loop2},2}.
{label,10}.
{test,is_eq_exact,{f,11},[{x,0},{integer,0}]}.
{move,{x,1},{x,0}}.
return.
{label,11}.
{gc_bif,'-',{f,0},2,[{x,0},{integer,1}],{x,2}}.
{gc_bif,'*',{f,0},3,[{x,0},{x,1}],{x,1}}.
{move,{x,2},{x,0}}.
{call_only,2,{f,10}}.
%% 调用 call_only opcode 没有建立堆栈的过程
{function, module_info, 0, 13}.
{label,12}.
{func_info,{atom,tailcall},{atom,module_info},0}.
{label,13}.
{move,{atom,tailcall},{x,0}}.
{call_ext_only,1,{extfunc,erlang,get_module_info,1}}.
{function, module_info, 1, 15}.
{label,14}.
{func_info,{atom,tailcall},{atom,module_info},1}.
{label,15}.
{move,{x,0},{x,1}}.
{move,{atom,tailcall},{x,0}}.
{call_ext_only,2,{extfunc,erlang,get_module_info,2}}.
我们在beam_emu.c中可以看到:
#define AllocateZero(Ns, Live) \
do { Eterm* ptr; \
int i = (Ns); \
AH(i, 0, Live); \
for (ptr = E + i; ptr > E; ptr--) { \
make_blank(*ptr); \
} \
} while (0)
#define AH(StackNeed, HeapNeed, M) \
do { \
int needed; \
needed = (StackNeed) + 1; \
if (E - HTOP < (needed + (HeapNeed))) { \
SWAPOUT; \
reg[0] = r(0); \
PROCESS_MAIN_CHK_LOCKS(c_p); \
FCALLS -= erts_garbage_collect(c_p, needed + (HeapNeed), reg, (M)); \
PROCESS_MAIN_CHK_LOCKS(c_p); \
r(0) = reg[0]; \
SWAPIN; \
} \
E -= needed; \
SAVE_CP(E); \
} while (0)
#define SAVE_CP(X) \
do { \
*(X) = make_cp(c_p->cp); \
c_p->cp = 0; \
} while(0)
#define RESTORE_CP(X) SET_CP(c_p, cp_val(*(X)))
#define D(N) \
RESTORE_CP(E); \
E += (N) + 1;
OpCase(deallocate_I): {
Eterm* next;
PreFetch(1, next);
D(Arg(0));
NextPF(1, next);
}
结论是:
尾递归的效率要比递归的好很多, 包括堆栈的使用和参数的分配,就是代码写起来不那么直观。
评论
11 楼
EQualizer
2009-10-01
The Book 写道
编译尾递归的函数可以使一系列语句最后的一个函数调用可以被替换为一个简单的跳转指令,指向被调用函数的开头。这就意味着一个尾递归的函数可以无限循环而不需要消耗栈空间。
10 楼
mryufeng
2009-09-25
编译器可以做些 明显的可以转换的 但是人工又懒的去转的那种 就可以了。 我很喜欢erlang factory推荐的那个tidier 很强大,有人工的智能来帮你做erlang的最佳实践,不知道什么时候可以release给大众。
9 楼
t0uch
2009-09-25
Trustno1 写道
weiqingfei 写道
编译器能不能考虑把非尾递归优化为尾递归?
noway
并不是所有的递归都能转化成尾递归吧
8 楼
mryufeng
2009-09-25
尾递归和递归在erlang vm里占用的空间不同 一个使用堆 一个使用栈 但是都在一个进程的空间里, 所以效率差不多。 只是使用heap会很灵活 效率更高些些。
7 楼
argan
2009-09-25
受教了,新版本的erlang在有些情况下,非尾递归的性能不一定差的,所以有时候不写尾递归也无所谓
6 楼
mryufeng
2009-09-25
大部分是尾递归呀 部分的数据集很小 也无所谓的
5 楼
Trustno1
2009-09-25
xvyu 写道
但是erlang的很多标准库都没有用尾递归,比方lists,这是为什么呢
good enough.
4 楼
xvyu
2009-09-25
但是erlang的很多标准库都没有用尾递归,比方lists,这是为什么呢
3 楼
litaocheng
2009-09-25
开始只是知道要怎么做,在老大的剖析下知道了为什么这么做...
继续啊!
继续啊!
2 楼
Trustno1
2009-09-25
weiqingfei 写道
编译器能不能考虑把非尾递归优化为尾递归?
noway
1 楼
weiqingfei
2009-09-25
编译器能不能考虑把非尾递归优化为尾递归?
发表评论
-
OTP R14A今天发布了
2010-06-17 14:36 2720以下是这次发布的亮点,没有太大的性能改进, 主要是修理了很多B ... -
R14A实现了EEP31,添加了binary模块
2010-05-21 15:15 3080Erlang的binary数据结构非常强大,而且偏向底层,在作 ... -
如何查看节点的可用句柄数目和已用句柄数
2010-04-08 03:31 4849很多同学在使用erlang的过程中, 碰到了很奇怪的问题, 后 ... -
获取Erlang系统信息的代码片段
2010-04-06 21:49 3511从lib/megaco/src/tcp/megaco_tcp_ ... -
iolist跟list有什么区别?
2010-04-06 20:30 6575看到erlang-china.org上有个 ... -
erlang:send_after和erlang:start_timer的使用解释
2010-04-06 18:31 8449前段时间arksea 同学提出这个问题, 因为文档里面写的很不 ... -
Latest news from the Erlang/OTP team at Ericsson 2010
2010-04-05 19:23 2040参考Talk http://www.erlang-factor ... -
对try 异常 运行的疑问,为什么出现两种结果
2010-04-05 19:22 2887郎咸武<langxianzhe@163.com> ... -
Erlang ERTS Async基础设施
2010-03-19 00:03 2566其实Erts的Async做的很不错的, 相当的完备, 性能又高 ... -
CloudI 0.0.9 Released, A Cloud as an Interface
2010-03-09 22:32 2511基于Erlang的云平台 看了下代码 质量还是不错的 完成了不 ... -
Memory matters - even in Erlang (再次说明了了解内存如何工作的必要性)
2010-03-09 20:26 3490原文地址:http://www.lshift.net/blog ... -
Some simple examples of using Erlang’s XPath implementation
2010-03-08 23:30 2076原文地址 http://www.lshift.net/blog ... -
lcnt 环境搭建
2010-02-26 16:19 2644抄书:otp_doc_html_R13B04/lib/tool ... -
Erlang强大的代码重构工具 tidier
2010-02-25 16:22 2506Jan 29, 2010 We are very happy ... -
[Feb 24 2010] Erlang/OTP R13B04 has been released
2010-02-25 00:31 1412Erlang/OTP R13B04 has been rele ... -
R13B04 Installation
2010-01-28 10:28 1427R13B04后erlang的源码编译为了考虑移植性,就改变了编 ... -
Running tests
2010-01-19 14:51 1516R13B03以后 OTP的模块加入了大量的测试模块,这些模块都 ... -
R13B04在细化Binary heap
2010-01-14 15:11 1526从github otp的更新日志可以清楚的看到otp R13B ... -
R13B03 binary vheap有助减少binary内存压力
2009-11-29 16:07 1685R13B03 binary vheap有助减少binary内存 ... -
erl_nif 扩展erlang的另外一种方法
2009-11-26 01:02 3257我们知道扩展erl有2种方法, driver和port. 这2 ...
相关推荐
6. **尾递归优化**:在某些情况下,如果函数的最后一条语句是调用自身(即尾递归),编译器可以进行优化,避免额外的栈空间开销,使得递归调用更高效。 7. **调用约定**:不同函数调用约定(如cdecl、stdcall、...
- **循环优化**:介绍循环展开、尾递归消除等优化技术,减少循环次数,提升执行速度。 - **内存管理**:讲解如何有效利用RAM和ROM资源,包括堆栈管理、静态与动态内存分配。 5. **调试与测试** - **仿真器与调试...
19. **编译过程**:C/C++程序经过预处理、编译、汇编和链接四个步骤形成可执行程序。 20. **程序执行过程**:在程序的执行过程中,系统通常使用栈来实现函数的嵌套调用(递归调用),栈可以保证最后调用的函数最先...
本文将基于给定的文件信息,详细阐述ARM编程中的一些实用技巧,涵盖编译器优化、C/C++与汇编混合编程、数据管理、以及特定的编译器特性,如优化级别、自动优化、冗余代码消除、指令编排、尾调用优化和内联函数。...
- **解析:**数据表示是指在硬件层面上如何表示数据,包括数据的二进制编码方式等,这是硬件可以直接识别和处理的数据类型。 **7. 流水线全局相关的处理方法** - **选项分析:** - A. 采取延迟转移:通过推迟分支...