前言:本文是结构体的进阶内容,会详细说明结构体的内存储存方式以及其内存对齐的作用是什么,如果有不了解结构体是什么的小伙伴建议先去学习一下C语言——结构体详解。
请允许我用一个问题来打开结构体内存对齐的学习。
请问下面这个代码的运行结果是多少呢?
#include<stdio.h> struct text1 { char i; int j; char p; }; int main() { printf("结构体text1的大小=%d", sizeof(struct text1)); return 0; }
运行结果:
为什么答案是12而不是6呢?这里就需要用到我们的结构体内存对齐规则了。
结构体内存对齐的规则
1.第一个结构体成员在与结构体变量偏移量为0的地址处。
2.其它结构体成员要对齐到对应的对齐数的整数倍的地址处
对齐数:编译器默认的一个对齐数与该结构体成员大小的较小值。
VS中默认值为8
linux以及gcc编译器等没有默认对齐数,对齐数就是结构体成员自身的大小
3.结构体的总大小为最大对齐数(每个结构体成员都有一个对齐数)的整数倍。
4.如果结构体中嵌套结构体,则嵌套的结构体需要对齐到自己的最大对齐数的整数倍处,而结构体的整体大小是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
接下来我会通过代码逐一解释这些规则
首先我们需要引入一个全新的概念——偏移量(结构体中某地址相对于首地址的偏移)
有了这个概念后,我们再来对结构体text1的内存结构进行画图。
struct text1
{
char i;
int j;
char p;
};
首先第一个结构体成员在与结构体变量偏移量为0的地址处。
接着其它结构体成员要对齐到对应的对齐数的整数倍的地址处,而对齐数是该编译器默认对齐数和成员变量的大小之间的较小值,对于int j,其值为4,而vs里的默认对齐数为8,所以j要对齐到4的整数倍的地址处。同理char p的对齐数为1,储存在j的下面1位。
我们可以看到现在一共占了9个字节,但是结构体的总大小为最大对齐数(每个结构体成员都有一个对齐数)的整数倍。所以应该是4的整数倍,所以大小为12。
结构体中嵌套结构体
如果大家看懂了上面的内容的话,理解嵌套结构体是轻而易举的事情:如果结构体中嵌套结构体,则
嵌套的结构体需要对齐到自己的最大对齐数的整数倍处
,而结构体的整体大小是所有最大对齐数
(含嵌套结构体的对齐数)的整数倍。
下面以代码为例子:
#include<stdio.h>
struct s1
{
double c;
char d;
int e;
};
struct s2
{
int a;
struct s1 S1; //嵌套结构体
char b;
};
int main()
{
printf("%d", sizeof(struct s2));
return 0;
}
输出结果为:
解释图:
修改默认对齐数
结构体在对齐方式不合适的时候,我们可以自己更改默认对齐数。
使用时,在开头添加#pragma pack(n)
n为想要更改成的默认对齐数
结束时,若想取消自己更改的默认对齐数,则添加#pragma pack ()
更改的默认对齐数一般都是2的倍数。
比如我想将默认对齐数改为1,仍以文章开头的代码为例:
#include<stdio.h>
#pragma pack(1) //将默认对齐数改为1
struct text1
{
char i;
int j;
char p;
};
#pragma pack() //取消自己更改的默认对齐数
int main() {
printf("结构体text1的大小=%d", sizeof(struct text1));
return 0;
}
运行结果:
为什么存在内存对齐
1.性能原因:结构数据(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问进需要一次访问即可。
2.平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
总的来说:结构体的内存对齐时拿空间换取时间的做法。
感谢大家的阅读,要是还有什么疑问的话欢迎来评论区进行讨论。