`

内存对齐

c 
阅读更多
看书看到内存对齐一段时,突然想研究一下内存对齐最底层的原理.查找资料后总结如下.

先用一句话来概括:
数据项只能存储在地址是数据项大小的整数倍的内存位置上” 例如int是4个字节,则只能在地址是0,4,8等位置上(即最后字节可以整除4).

不同的系统有不同的对齐系数(一般32位系统是4字节(正好是32位数据线宽度),64位是8),,可以通过#pragma pack(n)来设置.大于N的类型按N为基准来对齐.小于N的按自己为基准对齐.
如对齐系数是4,
struct test{
    int a; sizeof(a) = 4 == 4,按4对齐(占据0-3)
    char b; sizeof(b) == 1 < 4,按1对齐(占据4)
    double c; sizeof(c) == 8 > 4,按4对齐(占据8-15)
}
最后再整体对齐.对齐规则为test中最大的类型与对齐系数相比较.以其中较小的为基准.如test中最大为c,则以min(c, 对齐系数为基准).所以是4.
总共16个字节

其中进入一个函数时会首先进行栈对齐.保证以后的存取是效率的.

CPU 的访问粒度不仅仅是大小限制,地址上也有限制。也就是说,CPU 只能访问对齐地址上的固定长度的数据。
以四字节对齐为例,就是只能访问 0x0-0x3, 0x4-0x7, 0x8-0xc 这样的(闭)区间,不能跨区间访问。4字节32位,正好是数据总线宽度.
如果真正需要访问的数据并没有占据那个区间的全部字节范围,还有另外的信号线来指出具体操作哪几个字节,类似于掩码的作用。好像也有些架构干脆就不允许这种部分访问,强制要求按粒度访问。

如果一个数据跨越了两个这样的区间,那么就只能将这个数据的操作拆分成两部分,分别执行,效率当然就低了。

CPU在取数据时使用缓存,每次缓冲固定大小的数据(32位系统一次缓存32位即4字节,64位一次缓存64位即8字节,应该是缓存在寄存器里)

对齐原因小结:各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的CPU在访问一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字节对齐.其他平台可能没有这种情况,但是最常见的是如果不按照适合其平台要求对数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为32位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出这32bit,而如果存放在奇地址开始的地方,就需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。显然在读取效率上下降很多。


一、内存对齐的原因

大部分的参考资料都是如是说的:

1、平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。

2、性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器可能需要作两次内存访问(如32位CPU一次取4字节的数据,0x0-0x3,如果正好两字节的数据存储在0x3-0x4上,则CPU会进行两次读取,效率太低.);而对齐的内存访问仅需要一次访问。


以下为摘抄
来自:http://www.cnblogs.com/OYK/archive/2012/02/17/2356050.html


二、对齐规则

每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。程序员可以通过预编译命令#pragma pack(n),n=1,2,4,8,16来改变这一系数,其中的n就是你要指定的“对齐系数”。

规则:

1、数据成员对齐规则:结构(struct)(或联合(union))的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员的对齐按照#pragma pack指定的数值和这个数据成员

自身长度中,比较小的那个进行。

2、结构(或联合)的整体对齐规则:在数据成员完成各自对齐之后,结构(或联合)本身也要进行对齐,对齐将按照#pragma pack指定的数值和结构(或联合)最大数据成员长度中,比较小的那个进行。

3、结合1、2可推断:当#pragma pack的n值等于或超过所有数据成员长度的时候,这个n值的大小将不产生任何效果。



三、试验

下面我们通过一系列例子的详细说明来证明这个规则

编译器:GCC 3.4.2、VC6.0

平台:Windows XP



典型的struct对齐

struct定义:

#pragma pack(n) /* n = 1, 2, 4, 8, 16 */

struct test_t {

int a;

char b;

short c;

char d;

};

#pragma pack(n)

首先确认在试验平台上的各个类型的size,经验证两个编译器的输出均为:

sizeof(char) = 1

sizeof(short) = 2

sizeof(int) = 4



试验过程如下:通过#pragma pack(n)改变“对齐系数”,然后察看sizeof(struct test_t)的值。



1、1字节对齐(#pragma pack(1))

输出结果:sizeof(struct test_t) = 8 [两个编译器输出一致]

分析过程:

1) 成员数据对齐

#pragma pack(1)

struct test_t {

int a;  /* 长度4 > 1 按1对齐;起始offset=0 0%1=0;存放位置区间[0,3] */

char b;  /* 长度1 = 1 按1对齐;起始offset=4 4%1=0;存放位置区间[4] */

short c; /* 长度2 > 1 按1对齐;起始offset=5 5%1=0;存放位置区间[5,6] */

char d;  /* 长度1 = 1 按1对齐;起始offset=7 7%1=0;存放位置区间[7] */

};

#pragma pack()

成员总大小=8



2) 整体对齐

整体对齐系数 = min((max(int,short,char), 1) = 1

整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 8 /* 8%1=0 */ [注1]



2、2字节对齐(#pragma pack(2))

输出结果:sizeof(struct test_t) = 10 [两个编译器输出一致]

分析过程:

1) 成员数据对齐

#pragma pack(2)

struct test_t {

int a;  /* 长度4 > 2 按2对齐;起始offset=0 0%2=0;存放位置区间[0,3] */

char b;  /* 长度1 < 2 按1对齐;起始offset=4 4%1=0;存放位置区间[4] */

short c; /* 长度2 = 2 按2对齐;起始offset=6 6%2=0;存放位置区间[6,7] */

char d;  /* 长度1 < 2 按1对齐;起始offset=8 8%1=0;存放位置区间[8] */

};

#pragma pack()

成员总大小=9

2) 整体对齐

整体对齐系数 = min((max(int,short,char), 2) = 2

整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 10 /* 10%2=0 */



3、4字节对齐(#pragma pack(4))

输出结果:sizeof(struct test_t) = 12 [两个编译器输出一致]

分析过程:

1) 成员数据对齐

#pragma pack(4)

struct test_t {

int a;  /* 长度4 = 4 按4对齐;起始offset=0 0%4=0;存放位置区间[0,3] */

char b;  /* 长度1 < 4 按1对齐;起始offset=4 4%1=0;存放位置区间[4] */

short c; /* 长度2 < 4 按2对齐;起始offset=6 6%2=0;存放位置区间[6,7] */

char d;  /* 长度1 < 4 按1对齐;起始offset=8 8%1=0;存放位置区间[8] */

};

#pragma pack()

成员总大小=9



2) 整体对齐

整体对齐系数 = min((max(int,short,char), 4) = 4

整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 12 /* 12%4=0 */



4、8字节对齐(#pragma pack(8))

输出结果:sizeof(struct test_t) = 12 [两个编译器输出一致]

分析过程:

1) 成员数据对齐

#pragma pack(8)

struct test_t {

int a;  /* 长度4 < 8 按4对齐;起始offset=0 0%4=0;存放位置区间[0,3] */

char b;  /* 长度1 < 8 按1对齐;起始offset=4 4%1=0;存放位置区间[4] */

short c; /* 长度2 < 8 按2对齐;起始offset=6 6%2=0;存放位置区间[6,7] */

char d;  /* 长度1 < 8 按1对齐;起始offset=8 8%1=0;存放位置区间[8] */

};

#pragma pack()

成员总大小=9

2) 整体对齐

整体对齐系数 = min((max(int,short,char), = 4

整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 12 /* 12%4=0 */



5、16字节对齐(#pragma pack(16))

输出结果:sizeof(struct test_t) = 12 [两个编译器输出一致]

分析过程:

1) 成员数据对齐

#pragma pack(16)

struct test_t {

int a;  /* 长度4 < 16 按4对齐;起始offset=0 0%4=0;存放位置区间[0,3] */

char b;  /* 长度1 < 16 按1对齐;起始offset=4 4%1=0;存放位置区间[4] */

short c; /* 长度2 < 16 按2对齐;起始offset=6 6%2=0;存放位置区间[6,7] */

char d;  /* 长度1 < 16 按1对齐;起始offset=8 8%1=0;存放位置区间[8] */

};

#pragma pack()

成员总大小=9



2) 整体对齐

整体对齐系数 = min((max(int,short,char), 16) = 4

整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 12 /* 12%4=0 */

8字节和16字节对齐试验证明了“规则”的第3点:“当#pragma pack的n值等于或超过所有数据成员长度的时候,这个n值的大小将不产生任何效果”。



4结束语

内存分配与内存对齐是个很复杂的东西,不但与具体实现密切相关,而且在不同的操作系统,编译器或硬件平台上规则也不尽相同,虽然目前大多数系统/语言都具有自动管理、分配并隐藏低层操作的功能,使得应用程序编写大为简单,程序员不在需要考虑详细的内存分配问题。但是,在系统或驱动级以至于高实时,高保密性的程序开发过程中,程序内存分配问题仍旧是保证整个程序稳定,安全,高效的基础。
分享到:
评论

相关推荐

    内存对齐的问题 内存对齐内存对齐

    内存对齐,值得一读的内容, 内存对齐,值得一读的内容, 内存对齐,值得一读的内容, 内存对齐,值得一读的内容,

    内存对齐 详细介绍内存对齐的原理

    ### 内存对齐原理详解 #### 一、什么是内存对齐? 在计算机科学中,内存对齐(Memory Alignment)是指数据类型与内存地址之间的关系。简单来说,就是指数据结构(尤其是结构体中的成员)在内存中的起始地址应该...

    sizeof(结构体)和内存对齐

    sizeof(结构体)和内存对齐 sizeof(结构体)和内存对齐是C语言中一个重要的概念,它们之间存在着紧密的联系。sizeof(结构体)是指结构体在内存中的大小,而内存对齐是指编译器为了提高程序的效率和可移植性,对内存...

    C语言内存对齐,提高寻址效率

    C语言内存对齐的重要性 C语言内存对齐是指在编译器中对变量或结构体成员的存储地址进行调整,以提高寻址效率和存取效率。这是因为CPU在访问内存时,并不是可以访问任意编号的字节,而是以一定的步长来访问内存的。...

    计算机编程时使用到的内存对齐问题解答

    内存对齐是计算机编程中一个重要的概念,尤其是在优化程序性能和保证系统兼容性时不可或缺。内存对齐,简单来说,是指在计算机系统中,数据在内存中的存储位置必须按照特定的规则进行排列,以满足处理器的访问效率和...

    如何理解 struct 的内存对齐? - 知乎1

    内存对齐是计算机科学中关于数据结构存储的一种优化策略,主要应用于C++等低级编程语言。内存对齐的目标是确保数据在内存中的位置能够高效地被CPU访问,避免不必要的额外内存读取操作,提高程序运行速度。 在C++中...

    C中内存对齐

    在C语言中,内存对齐是一个重要的概念,它涉及到数据在计算机内存中的存储方式。内存对齐的主要目的是提高数据存取效率,减少CPU访问内存时的额外开销。当数据按照特定的规则排列在内存中,可以避免处理器进行不必要...

    内存对齐的规则以及作用 - 蜗牛小居 - C++博客1

    内存对齐是计算机科学中的一种优化技术,主要应用于编译器设计和编程语言实现中,目的是提高数据访问的效率和兼容性。它涉及到处理器架构、操作系统以及编程语言等多个层面。以下将详细介绍内存对齐的规则及其作用。...

    面试题1—内存对齐

    面试的时候内存对齐问的比较多,特从网上总结的面试题1.

    C++内存对齐

    ### C++内存对齐原理与实践 #### 一、引言 C++作为一种高效且功能强大的编程语言,在处理数据时需要特别关注内存管理问题。内存对齐是C++中的一个重要概念,它涉及到如何在内存中排列数据以提高程序的执行效率。...

    5分钟搞定内存字节对齐

    这个大小是经过内存对齐调整后的结果。那么,为什么需要内存对齐呢?内存对齐是为了提高程序的执行效率和可移植性。在不同的体系结构中,CPU 对不同类型的数据的处理速度是不同的。为了提高程序的执行效率,编译器会...

    3.2VC内存对齐准则共6页.pdf.zip

    在IT行业中,内存对齐是程序设计中一个重要的概念,特别是在使用C++或者C这样的低级别编程语言时。本文将详细解析"3.2VC内存对齐准则",这一主题通常与微软的Visual C++(VC)编译器相关,因为不同的编译器可能有...

    商业编程-源码-关于内存对齐.zip

    内存对齐是计算机科学中的一个重要概念,特别是在编程和系统设计中。它涉及到如何在内存中有效地安排数据结构,以优化性能、确保正确性并利用硬件特性。在这个“商业编程-源码-关于内存对齐.zip”文件中,我们很可能...

    结构体内存对齐.doc

    结构体内存对齐是计算机科学中关于数据结构在内存中存储的一种优化策略,主要涉及到C语言编程。内存对齐的目的是为了提高数据存取效率和兼容性,同时也与处理器架构和编译器有关。在C语言中,结构体的内存布局并不...

    内存对齐问题的完美解释.doc

    内存对齐是计算机科学中关于数据存储的一种策略,它的目的是优化数据访问速度并节省内存空间。在C语言中,`sizeof`操作符用于获取数据类型或变量所占用的内存大小。在描述的文档中,主要讨论了内存对齐在结构体`...

    C语言结构体内存对齐问题.pdf

    结构体的使用提高了程序对数据的组织能力,但随之而来的内存对齐问题,是一个影响性能和内存使用的细节问题。下面我们详细讨论结构体内存对齐的概念、原因以及如何影响结构体的总大小。 1. 内存对齐的基本概念 在...

    c++ 内存对齐的完整文档

    ### C++内存对齐原理与实践 #### 一、引言 在C++编程中,内存对齐(Memory Alignment)是一项重要的技术,它涉及到如何在内存中存储数据以提高程序的运行效率。良好的内存对齐不仅可以减少数据访问的时间,还可以...

Global site tag (gtag.js) - Google Analytics