1、结构体的声明
结构体是一些值的集合,这些值被称为成员变量。结构体中的每个成员可以是不同类型的变量。
语法:
struct tag //关键词 标签{member- list ;//成员清单}variable- list ;//变量清单
通常结构体描述的是一个复杂对象,比如描述一个学生:
struct Stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
};
通过结构体,我们可以方便的定义一个复杂对象。
2、结构体变量的创建和初始化
结构体创建变量的方式有两种,一是在定义结构体是创建在分号前面;第二种是在后面使用时再创建。类似的,初始化的方式也是这两种。
打印的方式也有两种,一种是直接引用(.),一种是间接引用(->).
#include <stdio.h>
struct Stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
};//s = {"张三", 20, "男", "20230818001" };
int main()
{
//按照结构体成员的顺序初始化
struct Stu s = { "张三", 20, "男", "20230818001" };
printf("name: %s\n", s.name);
printf("age : %d\n", s.age);
printf("sex : %s\n", s.sex);
printf("id : %s\n", s.id);
//按照指定的顺序初始化
struct Stu s2 = { .age = 18, .name = "lisi", .id = "20230818002", .sex = "⼥
printf("name: %s\n", s2->name);
printf("age : %d\n", s2->age);
printf("sex : %s\n", s2->sex);
printf("id : %s\n", s2->id);
return 0;
}
3、结构体的特殊声明情况
//匿名结构体类型
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}a[20], *p;
这种匿名结构体类型在声明时省略了结构体标签(tag)。这样会导致一些问题:
// 在上⾯代码的基础上,下⾯的代码合法吗?p = &x;编译器会把上面的两个声明当成完全不同的两个类型,所以时非法的。匿名的结构体类型如果没有对结构体类型重命名的话,基本上只能使用一次,因为没有tag标签导致无法对其进行二次使用。
4、结构体的自引用
在结构体中包含一个类型为该结构体本身的成员是否可行呢?
当我们定义一个链表的结点时:
struct Node
{
int data;
struct Node next;
};
其实这种方法时不可行的,仔细分析,因为一个结构体中再包含一个同类型的结构体变量,那么sizeof(struct Node)就会是无穷大的,像俄罗斯套娃一样,这不合理,会导致内存溢出,程序崩溃。
既然这样不行,我们就换一种方式,我们知道指针可以指向某一个地址,并且其占用内存的大小是固定的,我们可以用指针代替结构体成员。
struct Node
{
int data;
struct Node* next;
};
之前提过typedef可以对结构体进行重命名,但是在结构体自引用情况下也容易引入问题:
typedef struct
{
int data;
Node* next;
}Node;
typedef struct Node
{
int data;
struct Node* next;
}Node;
这样写是最安全的。
5、结构体的内存对齐
了解了结构体的使用方式后,我们还要能够计算结构体的大小,而这就需要我们了解结构体在内存中的储存方式,即结构体的内存对齐。
对齐规则
1. 结构体的第⼀个成员对⻬到和结构体变量起始位置偏移量为0的地址处2. 其他成员变量要对⻬到某个数字(对⻬数)的整数倍的地址处。( 对⻬数 = 编译器默认的⼀个对⻬数 与 该成员变量⼤⼩的较⼩值。)( VS 中默认的值为 8)( Linux中 gcc 没有默认对⻬数,对⻬数就是成员⾃⾝的⼤⼩)3、结构体总大小为最大对齐数(结构体中每个成员变量都有⼀个对⻬数,所有对⻬数中最⼤的)的整数倍。
4、 如果嵌套了结构体的情况,嵌套的结构体成员对⻬到⾃⼰的成员中最⼤对⻬数的整数倍处,结构 体的整体⼤⼩就是所有最⼤对⻬数(含嵌套结构体中成员的对⻬数)的整数倍。
//练习1
struct S1
{
char c1;
int i;
char c2;
};
printf("%d\n", sizeof(struct S1));//12
//练习2
struct S2
{
char c1;
char c2;
int i;
};
printf("%d\n", sizeof(struct S2));//8
//练习3
struct S3
{
double d;
char c;
int i;
};
printf("%d\n", sizeof(struct S3));//16
//练习4-结构体嵌套问题
struct S4
{
char c1;
struct S3 s3;
double d;
};
printf("%d\n", sizeof(struct S4));//32
练习一图解:
练习二图解:
练习三图解:
练习四图解:
存在内存对齐的原因
1、平台原因(移植原因):
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
char c2;
int i;
};
相同的变量类型放在集中位置的可能就会减少内存空间的浪费。
修改默认对齐数
#include <stdio.h>
#pragma pack(1)//设置默认对⻬数为1
struct S
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的对⻬数,还原为默认
int main()
{
//输出的结果是什么?
printf("%d\n", sizeof(struct S));
return 0;
}
6、结构体传参
结构体传参的方式有两种,分别是传值调用和传址调用。
struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
函数传参的时候,参数是需要压栈的,会有时间和空间上的系统开销。如果传递⼀个结构体对象的时候,结构体过⼤,参数压栈的的系统开销⽐较⼤,所以会导致性能的下降。所以考虑到性能和时空问题,我们在结构体传参的时候应该尽量去使用传址调用。
7、结构体实现位段
位段是结构体中的一个特殊功能,也就是说只有在结构体中才能使用位段。
位段的声明和结构体中的成员变量是类似的,但有两个不同:
1. 位段的成员必须是 int 、 unsigned int 或 signed int ,在C99中位段成员的类型也可以选择其他类型。2. 位段的成员名后边有⼀个冒号和⼀个数字。例如:struct A{int _a: 2 ;int _b: 5 ;int _c: 10 ;int _d: 30 ;};位段的作用就是可以尽可能的减小结构体占用内存的大小。我们可以使用打印函数去看一下使用位段后的结果。printf ( "%d\n" , sizeof ( struct A));结构体的大小从原来的16缩小到了8.
位段的内存分配
位段的使用有很多限制:1. 位段的成员可以是 int unsigned int signed int 或者是 char 等类型2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的⽅式来开辟的。3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使⽤位段。
//⼀个例⼦
struct S
{
char a:3;
char b:4;
char c:5;
char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
在vs中位段的成员是从右向左分配的, 当⼀个结构包含两个位段,第⼆个位段成员⽐较⼤,⽆法容纳于第⼀个位段剩余的位时,vs中会舍弃剩余的位,重新开辟一块空间继续自右向左分配成员。最后整合出的十六进制数在内存中也是看见的。
位段的跨平台问题
1. int 位段被当成有符号数还是⽆符号数是不确定的。2. 位段中最⼤位的数⽬不能确定。(16位机器最⼤16,32位机器最⼤32,写成27,在16位机器会出问题。3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。4. 当⼀个结构包含两个位段,第⼆个位段成员⽐较⼤,⽆法容纳于第⼀个位段剩余的位时,是舍弃剩余的位还是利⽤,这是不确定的。
总的来说,跟结构相⽐,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在。
位段的应用
位段使用的注意事项
位段的⼏个成员共有同⼀个字节,这样有些成员的起始位置并不是某个字节的起始位置,那么这些位置处是没有地址的。内存中每个字节分配⼀个地址,⼀个字节内部的bit位是没有地址的。
struct A
{
int _a : 2;
int _b : 5;
int _c : 10;
int _d : 30;
};
int main()
{
struct A sa = {0};
scanf("%d", &sa._b);//这是错误的
//正确的⽰范
int b = 0;
scanf("%d", &b);
sa._b = b;
return 0;
}