http://blog.csdn.net/lw1a2/archive/2006/09/05/1179068.aspx
8、从union的sizeof问题看cpu的对界
考虑下面问题:(默认对齐方式)
union u
{
double a;
int b;
};
union u2
{
char a[13];
int b;
};
union u3
{
char a[13];
char b;
};
cout<<sizeof(u)<<endl; // 8
cout<<sizeof(u2)<<endl; // 16
cout<<sizeof(u3)<<endl; // 13
都知道union的大小取决于它所有的成员中,占用空间最大的一个成员的大小。所以对于u来说,大小就是最大的double类型成员a了,所以sizeof(u)=sizeof(double)=8。但是对于u2和u3,最大的空间都是char[13]类型的数组,为什么u3的大小是13,而u2是16呢?关键在于u2中的成员int b。由于int类型成员的存在,使u2的对齐方式变成4,也就是说,u2的大小必须在4的对界上,所以占用的空间变成了16(最接近13的对界)。
结论:复合数据类型,如union,struct,class的对齐方式为成员中对齐方式最大的成员的对齐方式。
顺便提一下CPU对界问题,32的C++采用8位对界来提高运行速度,所以编译器会尽量把数据放在它的对界上以提高内存命中率。对界是可以更改的,使用#pragma pack(x)宏可以改变编译器的对界方式,默认是8。C++固有类型的对界取编译器对界方式与自身大小中较小的一个。例如,指定编译器按2对界,int类型的大小是4,则int的对界为2和4中较小的2。在默认的对界方式下,因为几乎所有的数据类型都不大于默认的对界方式8(除了long double),所以所有的固有类型的对界方式可以认为就是类型自身的大小。更改一下上面的程序:
#pragma pack(2)
union u2
{
char a[13];
int b;
};
union u3
{
char a[13];
char b;
};
#pragma pack(8)
cout<<sizeof(u2)<<endl; // 14
cout<<sizeof(u3)<<endl; // 13
由于手动更改对界方式为2,所以int的对界也变成了2,u2的对界取成员中最大的对界,也是2了,所以此时sizeof(u2)=14。
结论:C++固有类型的对界取编译器对界方式与自身大小中较小的一个。
9、struct的sizeof问题
因为对齐问题使结构体的sizeof变得比较复杂,看下面的例子:(默认对齐方式下)
struct s1
{
char a;
double b;
int c;
char d;
};
struct s2
{
char a;
char b;
int c;
double d;
};
cout<<sizeof(s1)<<endl; // 24
cout<<sizeof(s2)<<endl; // 16
同样是两个char类型,一个int类型,一个double类型,但是因为对界问题,导致他们的大小不同。计算结构体大小可以采用元素摆放法,我举例子说明一下:首先,CPU判断结构体的对界,根据上一节的结论,s1和s2的对界都取最大的元素类型,也就是double类型的对界8。然后开始摆放每个元素。
对于s1,首先把a放到8的对界,假定是0,此时下一个空闲的地址是1,但是下一个元素d是double类型,要放到8的对界上,离1最接近的地址是8了,所以d被放在了8,此时下一个空闲地址变成了16,下一个元素c的对界是4,16可以满足,所以c放在了16,此时下一个空闲地址变成了20,下一个元素d需要对界1,也正好落在对界上,所以d放在了20,结构体在地址21处结束。由于s1的大小需要是8的倍数,所以21-23的空间被保留,s1的大小变成了24。
对于s2,首先把a放到8的对界,假定是0,此时下一个空闲地址是1,下一个元素的对界也是1,所以b摆放在1,下一个空闲地址变成了2;下一个元素c的对界是4,所以取离2最近的地址4摆放c,下一个空闲地址变成了8,下一个元素d的对界是8,所以d摆放在8,所有元素摆放完毕,结构体在15处结束,占用总空间为16,正好是8的倍数。
这里有个陷阱,对于结构体中的结构体成员,不要认为它的对齐方式就是他的大小,看下面的例子:
struct s1
{
char a[8];
};
struct s2
{
double d;
};
struct s3
{
s1 s;
char a;
};
struct s4
{
s2 s;
char a;
};
cout<<sizeof(s1)<<endl; // 8
cout<<sizeof(s2)<<endl; // 8
cout<<sizeof(s3)<<endl; // 9
cout<<sizeof(s4)<<endl; // 16;
s1和s2大小虽然都是8,但是s1的对齐方式是1,s2是8(double),所以在s3和s4中才有这样的差异。
所以,在自己定义结构体的时候,如果空间紧张的话,最好考虑对齐因素来排列结构体里的元素。
10、不要让double干扰你的位域
在结构体和类中,可以使用位域来规定某个成员所能占用的空间,所以使用位域能在一定程度上节省结构体占用的空间。不过考虑下面的代码:
struct s1
{
int i: 8;
int j: 4;
double b;
int a:3;
};
struct s2
{
int i;
int j;
double b;
int a;
};
struct s3
{
int i;
int j;
int a;
double b;
};
struct s4
{
int i: 8;
int j: 4;
int a:3;
double b;
};
cout<<sizeof(s1)<<endl; // 24
cout<<sizeof(s2)<<endl; // 24
cout<<sizeof(s3)<<endl; // 24
cout<<sizeof(s4)<<endl; // 16
可以看到,有double存在会干涉到位域(sizeof的算法参考上一节),所以使用位域的的时候,最好把float类型和double类型放在程序的开始或者最后。
第一次写东西,发现自己的表达能力太差了,知道的东西讲不出来,讲出来的东西别人也看不懂,呵呵。另外,C99标准的sizeof已经可以工作在运行时了,打算最近找个支持C99的编译器研究一下。
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/lw1a2/archive/2006/09/05/1179068.aspx
分享到:
相关推荐
struct sembuf P, V; union semun arg; /* 创建信号量 */ fullid = semget(IPC_PRIVATE, 1, IPC_CREAT | 0666); emptyid = semget(IPC_PRIVATE, 1, IPC_CREAT | 0666); mutexid = semget(IPC_PRIVATE, 1, IPC...
例如,在数据类型方面,学习者需要区分int、float、char等基本类型,以及结构体(struct)和联合体(union)等复杂类型。在控制结构方面,学习者需要理解if-else条件语句、switch-case多分支选择结构、for、while和...
auto double int struct break else long switch case enum register typedef char extern return union const float short unsigned continue for signed void default goto sizeof volatile do while static f ...
- **面试常见问题解析**:通过对常见的C语言面试问题进行分析,帮助读者理解和掌握C语言的核心概念和技术点。 - **实战项目示例**:通过具体项目案例,展示如何运用C语言解决实际问题,加深对语言特性的理解。 ### ...
在结构中,编译器会根据每个成员的自然对界(alignment)规则来分配空间。自然对界指的是变量在内存中的起始地址应该满足特定的字节对齐,通常与变量的大小有关。例如,一个int型变量通常要求4字节对齐,而一个short...
- **字符串**:`string` 类型表示字符序列,可以是有界的也可以是无界的。 - **定义**:`typedef string<最大长度> 名称`。 - **示例**:`typedef string<15> Moniker;` 定义了一个长度不超过15个字符的字符串...
typedef struct { int syn; union value_type value; } word_type; ``` - `syn`: 代表Token的类型(如关键字、运算符等)。 - `value`: 存储Token的具体值。可以是整数(常量)、字符(如单个符号)或字符串(如...
1. **数据类型**:包括基本类型(如int、char、float、double)、枚举类型(enum)、结构体(struct)和联合体(union)。 2. **变量与常量**:变量用于存储数据,常量不可修改。 3. **运算符**:包括算术运算符(+...
IDL 中的序列类似于动态数组,可以定义无界或有界的序列: ```idl typedef sequence <long> UnboundeSeq; typedef sequence , 42> ShortBoundSeq; ``` 7. **数组**: IDL 中的数组定义在 Pascal 中表现为固定...
实验中提到需要处理标准C语言的32个关键字,这些关键字包括但不限于`auto`, `int`, `double`, `long`, `char`, `float`, `short`, `signed`, `unsigned`, `struct`, `union`, `enum`, `static`, `switch`, `case`, `...
**数据类型**:C语言支持基本的数据类型,如整型(int)、字符型(char)、浮点型(float和double)等,以及结构体(struct)和联合体(union)等复合数据类型。 **控制结构**:包括条件语句(if...else)、循环...
C语言则相对宽松,允许隐式类型转换,并提供了基本数据类型如int、float、double和char,以及复杂数据类型如结构体struct和联合体union。 4. 指针与内存管理: Pascal中的指针概念比较简洁,提供了类型安全的指针...
- **标准C关键字**:`char`, `int`, `short`, `long`, `signed`, `unsigned`, `float`, `double`, `const`, `void`, `volatile`, `enum`, `struct`, `union`, `typedef`, `auto`, `extern`, `static`, `register`, ...
结构体(struct)用于组织不同类型的数据项,而联合(union)用于同一内存空间存储不同类型的变量。这些数据结构提供了更为灵活的数据管理和组织方式。 ##### 3. 运算符与控制流语句 除了基本的算术和逻辑运算符外,...
1. 数据类型:C语言提供了基本的数据类型,如整型(int)、字符型(char)、浮点型(float、double)等,以及复合类型如结构体(struct)和联合体(union)。理解这些类型及其转换规则是掌握C语言的基础。 2. 控制...
联合体(union)也称为共用体,允许不同的数据类型共享同一段内存,主要用于节省空间和实现特殊功能。 #### 3.3 枚举类型 枚举类型(enum)是一种特殊的整型,用于定义一组命名的常量,使代码更具可读性和维护性。 ###...
由于【部分内容】提供的信息是一段混乱的...总结来说,C语言是计算机编程的基石之一,它的核心概念和特性对整个计算机科学界产生了深远的影响。掌握C语言对于理解计算机的工作原理以及编写高效、可靠的代码至关重要。
2. **数据类型**:C++支持多种数据类型,如整型(int)、浮点型(float和double)、字符型(char)以及自定义的数据结构如结构体(struct)和联合体(union)。理解每种类型的作用和使用场景是掌握C++的关键。 3. **函数**:...
"auto"|"double"|"int"|"struct"|"break"|"else"|"long"|"switch"|"case"|"enum"|"register"|"typedef"|"char"|"extern"|"return"|"union"|"const"|"float"|"short"|"unsigned"|"continue"|"for"|"signed"|"void"|...