`
weiyinchao88
  • 浏览: 1234362 次
文章分类
社区版块
存档分类
最新评论

转载--大内高手—栈/堆

 
阅读更多
大内高手—栈/堆
转载时请注明出处:http://blog.csdn.net/absurd
l
栈作为一种基本数据结构,我并不感到惊讶,用来实现函数调用,这也司空见惯的作法。直到我试图找到另外一种方式实现递归操作时,我才感叹于它的巧妙。要实现递归操作,不用栈不是不可能,而是找不出比它更优雅的方式。
尽管大多数编译器在优化时,会把常用的参数或者局部变量放入寄存器中。但用栈来管理函数调用时的临时变量(局部变量和参数)是通用做法,前者只是辅助手段,且只在当前函数中使用,一旦调用下一层函数,这些值仍然要存入栈中才行。
通常情况下,栈向下(低地址)增长,每向栈中PUSH一个元素,栈顶就向低地址扩展,每从栈中POP一个元素,栈顶就向高地址回退。一个有兴趣的问题:在x86平台上,栈顶寄存器为ESP,那么ESP的值在是PUSH操作之前修改呢,还是在PUSH操作之后修改呢?PUSH ESP这条指令会向栈中存入什么数据呢?据说x86系列CPU中,除了286外,都是先修改ESP,再压栈的。由于286没有CPUID指令,有的OS用这种方法检查286的型号。
一个函数内的局部变量以及其调用下一级函数的参数,所占用的内存空间作为一个基本的单元,称为一个帧(frame)。在gdb里,f 命令就是用来查看指定帧的信息的。在两个frame之间通过还存有其它信息,比如上一层frame的分界地址(EBP)等。
关于栈的基本知识,就先介绍这么多,我们下面来看看一些关于栈的技巧及应用:
1. backtrace的实现
callstack调试器的基本功能之一,利用此功能,你可以看到各级函数的调用关系。在gdb中,这一功能被称为backtrace,输入bt命令就可以看到当前函数的callstack。它的实现多少有些有趣,我们在这里研究一下。
我们先看看栈的基本模型
参数N
↓高地址
参数…
函数参数入栈的顺序与具体的调用方式有关
参数 3
参数 2
参数 1
EIP
返回本次调用后,下一条指令的地址
EBP
保存调用者的EBP,然后EBP指向此时的栈顶。
临时变量1
临时变量2
临时变量3
临时变量…
临时变量5
↓低地址
要实现callstack我们需要知道以下信息:
l 调用函数时的指令地址(即当时的EIP)。
l 指令地址对应的源代码代码位置。
关于第一点,从上表中,我们可以看出,栈中存有各级EIP的值,我们取出来就行了。用下面的代码可以轻易实现:
#include <stdio.h>
intbacktrace(void** BUFFER, intSIZE)
{
intn = 0;
int* p = &n;
inti = 0;
intebp = p[1];
inteip = p[2];
for(i = 0; i < SIZE; i++)
{
BUFFER[i] = (void*)eip;
p = (int*)ebp;
ebp = p[0];
eip = p[1];
}
returnSIZE;
}
#define N 4
staticvoidtest2()
{
inti = 0;
void* BUFFER[N] = {0};
backtrace(BUFFER, N);
for(i = 0; i < N; i++)
{
printf("%p/n",BUFFER[i]);
}
return;
}
staticvoidtest1()
{
test2();
}
staticvoidtest()
{
test1();
}
intmain(intargc, char* argv[])
{
test();
return 0;
}
程序输出:
0x8048460
0x804849c
0x80484a9
0x80484cc
关于第二点,如何把指令地址与行号对应起来,这也很简单。可以从MAP文件或者ELF中查询。Binutil带有一个addr2line的小工具,可以帮助实现这一点。
[root@linux bt]# addr2line0x804849c -e bt.exe
/root/test/bt/bt.c:42
2. alloca的实现
大家都知道动态分配的内存,一定要释放掉,否则就会有内存泄露。可能鲜有人知,动态分配的内存,可以不用释放。Alloca就是这样一个函数,最后一个a代表auto,即自动释放的意思。
Alloca是在栈中分配内存的。即然是在栈中分配,就像其它在栈中分配的临时变量一样,在当前函数调用完成时,这块内存自动释放。
正如我们前面讲过,栈的大小是有限制的,普通线程的栈只有10M大小,所以在分配时,要量力而行,且不要分配过大内存。
Alloca可能会渐渐的退出历史舞台,原因是新的C/C++标准都支持变长数组。比如int array[n],老版本的编译器要求n是常量,而新编译器允许n是变量。编译器支持的这一功能完全可以取代alloca。
这不是一个标准函数,但像linux和win32等大多数平台都支持。即使少数平台不支持,要自己实现也不难。这里我们简单介绍一下alloca的实现方法。
我们先看看一个小程序,再看看它对应的汇编代码,一切都清楚了。
#include <stdio.h>
intmain(intargc, char* argv[])
{
intn = 0;
int* p = alloca(1024);
printf("&n=%p p=%p/n", &n, p);
return 0;
}
汇编代码为:
intmain(intargc, char* argv[])
{
8048394: 55 push %ebp
8048395: 89 e5 mov %esp,%ebp
8048397: 83 ec 18 sub $0x18,%esp
804839a: 83 e4 f0 and $0xfffffff0,%esp
804839d: b8 00 00 00 00 mov $0x0,%eax
80483a2: 83 c0 0f add $0xf,%eax
80483a5: 83 c0 0f add $0xf,%eax
80483a8: c1 e8 04 shr $0x4,%eax
80483ab: c1 e0 04 shl $0x4,%eax
80483ae: 29 c4 sub %eax,%esp
intn = 0;
80483b0: c7 45 fc 00 00 00 00 movl $0x0,0xfffffffc(%ebp)
int* p = alloca(1024);
80483b7: 81 ec 10 04 00 00 sub $0x410,%esp
80483bd: 8d 44 24 0c lea 0xc(%esp),%eax
80483c1: 83 c0 0f add $0xf,%eax
80483c4: c1 e8 04 shr $0x4,%eax
80483c7: c1 e0 04 shl $0x4,%eax
80483ca: 89 45 f8 mov %eax,0xfffffff8(%ebp)
printf("&n=%p p=%p/n", &n, p);
80483cd: 8b 45 f8 mov 0xfffffff8(%ebp),%eax
80483d0: 89 44 24 08 mov %eax,0x8(%esp)
80483d4: 8d 45 fc lea 0xfffffffc(%ebp),%eax
80483d7: 89 44 24 04 mov %eax,0x4(%esp)
80483db: c7 04 24 98 84 04 08 movl $0x8048498,(%esp)
80483e2: e8 d1 fe ff ff call 80482b8 <printf@plt>
return 0;
80483e7: b8 00 00 00 00 mov $0x0,%eax
}
其中关键的一条指令为:sub $0x410,%esp
由此可以看出实现alloca,仅仅是把ESP减去指定大小,扩大栈空间(记记住栈是向下增长),这块空间就是分配的内存。
3. 可变参数的实现。
对新手来说,可变参数的函数也是比较神奇。还是以一个小程序来说明它的实现。
#include <stdio.h>
#include <stdarg.h>
intprint(constchar* fmt, ...)
{
int n1 = 0;
intn2 = 0;
int n3 = 0;
va_list ap;
va_start(ap, fmt);
n1 = va_arg(ap, int);
n2 = va_arg(ap, int);
n3 = va_arg(ap, int);
va_end(ap);
printf("n1=%d n2=%d n3=%d/n", n1, n2, n3);
return 0;
}
intmain(int arg, charargv[])
{
print("%d/n", 1, 2, 3);
return 0;
}
我们看看对应的汇编代码:
intprint(constchar* fmt, ...)
{
8048394: 55 push %ebp
8048395: 89 e5 mov %esp,%ebp
8048397: 83 ec 28 sub $0x28,%esp
int n1 = 0;
804839a: c7 45 fc 00 00 00 00 movl $0x0,0xfffffffc(%ebp)
intn2 = 0;
80483a1: c7 45 f8 00 00 00 00 movl $0x0,0xfffffff8(%ebp)
int n3 = 0;
80483a8: c7 45 f4 00 00 00 00 movl $0x0,0xfffffff4(%ebp)
va_list ap;
va_start(ap, fmt);
80483af: 8d 45 0c lea 0xc(%ebp),%eax
80483b2: 89 45 f0 mov %eax,0xfffffff0(%ebp)
n1 = va_arg(ap, int);
80483b5: 8b 55 f0 mov 0xfffffff0(%ebp),%edx
80483b8: 8d 45 f0 lea 0xfffffff0(%ebp),%eax
80483bb: 83 00 04 addl $0x4,(%eax)
80483be: 8b 02 mov (%edx),%eax
80483c0: 89 45 fc mov %eax,0xfffffffc(%ebp)
n2 = va_arg(ap, int);
80483c3: 8b 55 f0 mov 0xfffffff0(%ebp),%edx
80483c6: 8d 45 f0 lea 0xfffffff0(%ebp),%eax
80483c9: 83 00 04 addl $0x4,(%eax)
80483cc: 8b 02 mov (%edx),%eax
80483ce: 89 45 f8 mov %eax,0xfffffff8(%ebp)
n3 = va_arg(ap, int);
80483d1: 8b 55 f0 mov 0xfffffff0(%ebp),%edx
80483d4: 8d 45 f0 lea 0xfffffff0(%ebp),%eax
80483d7: 83 00 04 addl $0x4,(%eax)
80483da: 8b 02 mov (%edx),%eax
80483dc: 89 45 f4 mov %eax,0xfffffff4(%ebp)
va_end(ap);
printf("n1=%d n2=%d n3=%d/n", n1, n2, n3);
80483df: 8b 45 f4 mov 0xfffffff4(%ebp),%eax
80483e2: 89 44 24 0c mov %eax,0xc(%esp)
80483e6: 8b 45 f8 mov 0xfffffff8(%ebp),%eax
80483e9: 89 44 24 08 mov %eax,0x8(%esp)
80483ed: 8b 45 fc mov 0xfffffffc(%ebp),%eax
80483f0: 89 44 24 04 mov %eax,0x4(%esp)
80483f4: c7 04 24 f8 84 04 08 movl $0x80484f8,(%esp)
80483fb: e8 b8 fe ff ff call 80482b8 <printf@plt>
return 0;
8048400: b8 00 00 00 00 mov $0x0,%eax
}
intmain(intarg, charargv[])
{
8048407: 55 push %ebp
8048408: 89 e5 mov %esp,%ebp
804840a: 83 ec 18 sub $0x18,%esp
804840d: 83 e4 f0 and $0xfffffff0,%esp
8048410: b8 00 00 00 00 mov $0x0,%eax
8048415: 83 c0 0f add $0xf,%eax
8048418: 83 c0 0f add $0xf,%eax
804841b: c1 e8 04 shr $0x4,%eax
804841e: c1 e0 04 shl $0x4,%eax
8048421: 29 c4 sub %eax,%esp
intn = print("%d/n", 1, 2, 3);
8048423: c7 44 24 0c 03 00 00 movl $0x3,0xc(%esp)
804842a: 00
804842b: c7 44 24 08 02 00 00 movl $0x2,0x8(%esp)
8048432: 00
8048433: c7 44 24 04 01 00 00 movl $0x1,0x4(%esp)
804843a: 00
804843b: c7 04 24 0b 85 04 08 movl $0x804850b,(%esp)
8048442: e8 4d ff ff ff call 8048394 <print>
8048447: 89 45 fc mov %eax,0xfffffffc(%ebp)
return 0;
804844a: b8 00 00 00 00 mov $0x0,%eax
}
从汇编代码中,我们可以看出,参数是逆序入栈的。在取参数时,先让ap指向第一个参数,又因为栈是向下增长的,不断把指针向上移动就可以取出所有参数了。
l
在内存分配算法一节中再详细讲解。


Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=822885
分享到:
评论

相关推荐

    行业资料-交通装置-一种大内腔的汽车方向盘总成.zip

    行业资料-交通装置-一种大内腔的汽车方向盘总成.zip

    大内高手大内高手大内高手

    正如标题所暗示的“大内高手”,这里的“大内”实际上指的是计算机系统的内存,“高手”则比喻那些能够深入了解并熟练掌握内存管理机制的技术人员。在开发过程中,虽然对内存模型的理解不会直接影响编程技能,但它...

    linuxC内存极品文章《大内高手》

    ### Linux C内存管理详解——《大内高手》 #### 一、引言 在Linux环境下进行C语言编程时,深刻理解内存管理对于提高程序性能、增强软件稳定性以及提升开发效率至关重要。本文旨在全面解析Linux C内存管理的核心...

    李先静——大内高手系列

    《李先静——大内高手系列》是一套专注于C++编程技术的教程,由知名IT专家李先静编著。这个系列深入浅出地探讨了C++编程中的各种陷阱和难点,旨在帮助初学者和有经验的程序员避免常见的错误,提升编程技能。以下是该...

    大内高手--调试手段及原理

    知其然也知其所以然,是我们《大内高手》系列一贯做法,本文亦是如此。这里我不打算讲解如何使用boundschecker、purify、valgrind或者gdb,使用这些工具非常简单,讲解它们只是多此一举。相反,我们要研究一下这些...

    大内高手 编程高手完全笔记

    《大内高手 编程高手完全笔记》一书聚焦于编程实践中常见的问题,特别是调试手段和原理。在软件开发过程中,遇到的挑战往往涉及到内存管理、编译器优化以及调试技术。以下是对这些主题的详细阐述: 首先,从应用...

    大内高手(详细的内存知识)

    2. **栈/堆管理** - **backtrace**:用于跟踪函数调用路径,帮助分析程序执行流程。 - **alloca**:在栈上动态分配内存,释放时自动回收。 - **可变参数**:如`printf`函数,允许函数接收可变数量的参数,通过`...

    李先静_大内高手系列

    很抱歉,但根据您提供的信息,"李先静_大内高手系列"似乎是某个人物或课程系列的名称,而具体的文件名称列表只包含这一条重复的信息,这并不足以生成详细的IT知识。若要提供相关的IT知识,我需要更具体的内容,例如...

    ASP.NET Web API 2 框架揭秘-带源码版--蒋金楠(大内老A)

    由蒋金楠(大内老A)编写的《ASP.NET Web API 2 框架揭秘-带源码版》深入浅出地介绍了这个强大的工具,帮助开发者掌握其核心概念和技术。 首先,Web API 2 是ASP.NET框架的一部分,它为创建高效、可扩展且与平台...

    大内高手调试手段及原理-50页.pdf

    【大内高手调试手段及原理】这篇文章探讨了高级调试技巧,旨在深入了解调试工具的运作机制,而不仅仅是如何使用它们。作者没有详细介绍boundschecker、purify、valgrind或gdb等常见调试工具的使用方法,因为这些工具...

    CC++晋级经典资料.pdf

    **1.2 大内高手—栈/堆** - **栈**: 是一种先进后出的数据结构,通常用于保存函数调用时的局部变量和函数参数。栈的空间由操作系统自动管理,具有较快的访问速度。 - **堆**: 堆是一种动态内存分配区域,程序员可以...

    行业文档-设计装置-一种接杆式大内径测量工具.zip

    标题中的“行业文档-设计装置-一种接杆式大内径测量工具”表明这是一个关于工业设计和制造领域的技术文档,具体涉及的是一个采用接杆结构的大内径测量工具。这样的工具通常用于对大型管道、机械零件或其他有较大内部...

    大内 Java笔记

    【大内 Java 笔记】是一份非常经典的 Java 学习资源,主要涵盖了从环境配置到实际编程的全过程。这份笔记适用于已经有一定 Java 学习基础的读者,可以帮助他们更深入地理解和掌握 Java 开发环境的搭建以及基本的编程...

    java面试集合大内的

    java面试题暗示法法师嘎嘎个挨个发生巨额研究院统计引渡条约是是是

    JSP九大内建对象案例讲解

    在深入探讨JSP(JavaServer Pages)的九大内建对象之前,我们首先简要回顾一下JSP技术。JSP是一种服务器端脚本语言,用于创建动态网页,它将HTML、CSS、JavaScript与Java代码结合在一起,使开发者能够构建功能丰富的...

    2021-2022年收藏的精品资料若某公司期初存货低估1.doc

    11. 毛利法估算损失:题目11中,大内公司使用毛利法估算火灾损失。毛利率为($2,000,000-$1,600,000) / $2,000,000 = 20%,X4年销货成本=$2,500,000 * (1-20%) = $2,000,000,X4年底应有存货=$800,000 + $2,200,000 -...

    大内笔记JAVA基础知识的小总结

    【Java基础知识】 Java是一种广泛使用的面向对象的编程语言,由Sun Microsystems开发,现在由甲骨文公司维护。它的设计理念是“一次编写,到处运行”,这得益于Java虚拟机(JVM),它允许Java程序在任何支持Java的...

    大内安卓学习资料demo全套

    【大内安卓学习资料demo全套】是一份全面的安卓开发学习资源集合,旨在为初学者提供一个月完整的学习路径。这份资料可能涵盖了从基础概念到实际应用的各种知识点,以帮助学习者扎实地掌握安卓开发技能。"达内"作为...

Global site tag (gtag.js) - Google Analytics