1. 结构体的大小
在自己正真了解过之前,一直认为结构体的大小就是结构体内部成员大小的总和。
但当你去尝试打印结构体的大小时,会发现事实并非如此,也不会像你想的那样简单。
#include <stdio.h>
struct S1
{
char c1;
char c2;
int i;
};
struct S2
{
char c1;
int i;
char c2;
};
int main()
{
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
return 0;
}
给出这样的两个结构体,它们的元素完全相同,只是定义的顺序不一样。
按照直觉来说,它们的大小都应该是两个字符和一个整形的大小的总和,也就是6。
但是当我们实际打印出来之后会发现,struct S1的大小是8,而struct S2的大小是12。
也就是说,结构体的大小肯定不只是由其成员的大小和数量决定,至少还会与其成员定义的顺序有关。
那么,结构体的大小到底存在着什么样的机制呢?
这个所谓的机制,就是结构体内存对齐。
2. 结构体内存对齐
结构体内存对齐,就是指结构体成员在被定义时所分配到的空间并不是连续的,而是会基于不同变量对齐数的不同,去对应某些固定的位置的空间。
2.1 为什么要对齐
按理来说,对齐应该会导致元素因为没有紧密排列而造成空间的浪费,那么为什么要对齐呢?
2.1.1 平台原因
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2.1.2 性能原因
数据结构(尤其是栈)应该尽可能地在自然然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要⼀次访问。假设⼀个处理器总是从内存中取4个字节,则地址必须是4的倍数。如果我们能保证将所有的int类型的数据的地址都对齐成4的倍数(相对于结构体首个字节的地址来说),那么就可以用⼀个内存操作来读或者写值了。否则,我们可能需要执行两次内存访问,因为对象可能被分放在两个4字节内存块中。
以struct S2为例:
struct S2
{
char c1;
int i;
char c2;
};
总体来说:结构体的内存对齐是拿空间来换取时间的做法。
2.2 对齐规则
1. 结构体的第⼀个成员对齐到和结构体变量起始位置偏移量(相距的字节数)为0的地址处。
2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的⼀个对齐数 与 该成员变量大小的较小值。
- VS 中默认的值为 8
- Linux中 gcc 没有默认对齐数,对齐数就是成员自身的大小
3. 结构体总大小为最大对齐数(结构体中每个成员变量都有⼀个对齐数,所有对齐数中最大的)的整数倍。
4. 如果嵌套了结构体的情况,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍。
2.3 举例
2.3.1 struct S1
struct S1
{
char c1;
char c2;
int i;
};
1. c1作为第一个成员,在结构体的首地址处;
2. c2对齐数为1,所以紧贴着上一个元素;
3. i对齐数为4,由于前四格空间已经被占用,所以i向后寻找到的第一个为4的倍数的地址如图;
4. 最大对齐数为4,而8刚好是4的倍数,于是结构体大小为4。
2.3.2 struct S2
struct S2
{
char c1;
int i;
char c2;
};
1. c1作为第一个成员,在结构体的首地址处;
2. i对齐数为4,由于前四格空间已经被占用,所以i向后寻找到的第一个为4的倍数的地址如图;
3. c2对齐数为1,紧贴着前面一个元素;
4. 最大对齐数为4,目前结构体已经占用了9个字节,由于结构体的大小需要是4的倍数,所以其大小只能为12了。
2.3.3 其他
struct S3//16
{
double d;
char c;
int i;
};
struct S4//32
{
char c1;
struct S3 s3;
double d;
};
这两个案例可以自己尝试一下,要自己动手才能记得牢,不是我懒得写。
2.4 修改默认对齐数
用“#pragma()”这个预处理指令,可以修改默认对齐数。
#pragma pack(4)//默认对齐数改为4
#pragma pack()//恢复默认对齐数
#pragma pack(1)//等价于不对齐