你应该知道的C语言性能提升法之结构体优化

在这里插入图片描述
前两天码哥写了一篇《你应该知道的C语言Cache命中率提升法》的文章,讲述关于地址连续性带来的cache命中率提升,感兴趣的朋友可以先翻看一番。

今天的文章是关于如何优化结构体成员来提升cache命中率的。我们先来看一个例子:

代码一
/* a.c */
#include <stdio.h>
#include <sys/time.h>

typedef struct test_s {
    long i0;
    char padding0[1024];
    long i1;
    char padding1[1024];
    long i2;
    char padding2[1024];
    long i3;
    char padding3[1024];
    long i4;
    char padding4[1024];
    long i5;
    char padding5[1024];
    long i6;
    char padding6[1024];
    long i7;
    char padding7[1024];
    long i8;
    char padding9[1024];
    long i9;
} test_t;

int main(void)
{
    test_t arr[512];
    int i;
    struct timeval begin, end;
    gettimeofday(&begin, NULL);
    for (i = 0; i < sizeof(arr)/sizeof(test_t); ++i) {
        arr[i].i0 = 0;
        arr[i].i1 = 1;
        arr[i].i2 = 2;
        arr[i].i3 = 3;
        arr[i].i4 = 4;
        arr[i].i5 = 5;
        arr[i].i6 = 6;
        arr[i].i7 = 7;
        arr[i].i8 = 8;
        arr[i].i9 = 9;
    }
    gettimeofday(&end, NULL);
    printf("%lu(us)\n", (end.tv_sec*1000000+end.tv_usec)-(begin.tv_sec*1000000+begin.tv_usec));
    return 0;
}

功能很简单,我们定义了一个结构体,其中有很多padding,这些padding是用来模拟日常项目中不常访问的结构体成员。然后我们定义了这样一个结构体数组,顺序访问每个结构体,并将其中的整型成员进行赋值,并度量这一循环的时间开销。

在码哥的测试机上,执行的结果大约是:

$ ./a
2487(us)

参考我们之前的那篇关于地址连续性带来cache命中率提升想法,上面这个例子是否有性能提升的空间呢?

答案当然是有的。请看下面的代码:

代码二
/* b.c */
#include <stdio.h>
#include <sys/time.h>

typedef struct test_s {
    long i0;
    long i1;
    long i2;
    long i3;
    long i4;
    long i5;
    long i6;
    long i7;
    long i8;
    long i9;
    char padding0[1024];
    char padding1[1024];
    char padding2[1024];
    char padding3[1024];
    char padding4[1024];
    char padding5[1024];
    char padding6[1024];
    char padding7[1024];
    char padding8[1024];
} test_t;

int main(void)
{
    test_t arr[512];
    int i;
    struct timeval begin, end;
    gettimeofday(&begin, NULL);
    for (i = 0; i < sizeof(arr)/sizeof(test_t); ++i) {
        arr[i].i0 = 0;
        arr[i].i1 = 1;
        arr[i].i2 = 2;
        arr[i].i3 = 3;
        arr[i].i4 = 4;
        arr[i].i5 = 5;
        arr[i].i6 = 6;
        arr[i].i7 = 7;
        arr[i].i8 = 8;
        arr[i].i9 = 9;
    }
    gettimeofday(&end, NULL);
    printf("%lu(us)\n", (end.tv_sec*1000000+end.tv_usec)-(begin.tv_sec*1000000+begin.tv_usec));
    return 0;
}

可以看到,这段代码中出了结构体中成员的位置有所调整外,其余代码都是一致的,甚至结构体的大小都是一样的。

那么这段代码的执行时间又是如何的呢?

$ ./b
1034(us)

可以看到这个结果比代码一快了1倍左右。

总结

为何会快出1倍,原因与地址连续性依旧有关。代码二中,常被访问的10个整型成员被安排在了一起,这样当访问其中一个时,可以尽可能多的将可能被访问的成员预加载到cache中。而代码一中,由于间隔了很多padding,且每个padding也比较大,因此cache缓存了很多不常被访问的部分,所以在我们给每一个整型赋值时都无法利用到前一次赋值的cache缓存,因此效率有所降低。

结论很简单,尽可能将常访问的结构体成员放在一起,甚至推荐贴近结构体开始处存放。



喜欢的朋友欢迎关注码哥,也可以在下方给码哥留言评论。

感谢阅读!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/258698.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

一文教你提高写代码效率,程序员别错过!

首先&#xff0c;每个程序员都是会利用工具的人&#xff0c;也有自己囊里私藏的好物。独乐乐不如众乐乐&#xff0c;今天笔者整理了 3 个辅助我们写代码的黑科技&#xff0c;仅供参考。如果你有更好的工具&#xff0c;欢迎评论区分享。 1、Google/Stackoverflow——搜索解决方…

ChimeraX使用教程-安装及基本操作

ChimeraX使用教程-安装及基本操作 1、访问https://www.cgl.ucsf.edu/chimerax/download.html进行下载&#xff0c;然后安装 安装完成后&#xff0c;显示界面 2、基本操作 1、点击file&#xff0c;导入 .PDB 文件。 &#xff08;注&#xff1a;在 alphafold在线预测蛋白》点…

编码器的数学描述

在数字信号处理和通信系统中&#xff0c;编码器扮演着非常重要的角色&#xff0c;它负责将原始信号转换成特定的编码形式&#xff0c;以便于传输、存储和处理。编码器的数学描述是理解其原理和设计实现的关键。本文将围绕编码器的数学描述展开&#xff0c;介绍编码器的基本原理…

智能物联网汽车3d虚拟漫游展示增强消费者对品牌的认同感和归属感

汽车3D虚拟展示系统是一种基于web3D开发建模和VR虚拟现实技术制作的360度立体化三维汽车全景展示。它通过计算机1:1模拟真实的汽车外观、内饰和驾驶体验&#xff0c;让消费者在购车前就能够更加深入地了解车辆的性能、特点和设计风格。 华锐视点云展平台是一个专业的三维虚拟展…

2023年中国法拍房用户画像和数据分析

法拍房主要平台 法拍房主要平台有3家&#xff0c;分别是阿里、京东和北交互联平台。目前官方认定纳入网络司法拍卖的平台共有7家&#xff0c;其中阿里资产司法拍卖平台的挂拍量最大。 阿里法拍房 阿里法拍房数据显示2017年&#xff0c;全国法拍房9000套&#xff1b;2018年&a…

C语言归并排序(合并排序)算法以及代码

合并排序是采用分治法&#xff0c;先将无序序列划分为有序子序列&#xff0c;再将有序子序列合并成一个有序序列的有效的排序算法。 原理&#xff1a;先将无序序列利用二分法划分为子序列&#xff0c;直至每个子序列只有一个元素(单元素序列必有序)&#xff0c;然后再对有序子序…

【VScode和Leecode的爱恨情仇】command ‘leetcode.signin‘ not found

文章目录 一、关于command ‘leetcode.signin‘ not found的问题二、解决方案第一&#xff0c;没有下载Nodejs&#xff1b;第二&#xff0c;有没有在VScode中配置Nodejs第三&#xff0c;力扣的默认在VScode请求地址中请求头错误首先搞定配置其次搞定登入登入方法一&#xff1a;…

netty线程调度定制

1、netty的线程调度问题 在netty的TCP调度中&#xff0c;线程的调度封装在NioEventLoopGroup中&#xff0c;线程执行则封装在NioEventLoop中。 线程调度规则封装在MultithreadEventExecutorGroup的next方法中&#xff0c;这个方法又封装了EventExecutorChooserFactory&#xf…

ArkTS @Observed、@ObjectLink状态装饰器的使用

作用 Observed、ObjectLink装饰器用于在涉及嵌套对象或者数组元素为对象的场景中进行双向数据同步。 状态的使用 1.嵌套对象 我们将父类设置为Observed状态&#xff0c;这个时候&#xff0c;子应该设置ObjectLink才能完成数据的双向绑定&#xff0c;所以我们构建一个组件&…

控制理论simulink+matlab

这里写目录标题 根轨迹二级目录三级目录 根轨迹 z [-1]; %开环传递函数的零点 p [0 -2 -3 -4]; %开环传递函数的系统极点 k 1; %开环传递函数的系数&#xff0c;反映在比例上 g zpk(z,p,k); %生成开环传递函数%生成的传递函数如下 % (s1) % -------------…

Vue3-23-组件-依赖注入的使用详解

什么是依赖注入 个人的理解 &#xff1a; 依赖注入&#xff0c;是在 一颗 组件树中&#xff0c;由 【前代组件】 给 【后代组件】 提供 属性值的 一种方式 &#xff1b;这种方式 突破了 【父子组件】之间通过 props 的方式传值的限制&#xff0c;只要是 【前代组件】提供的 依…

「Qt Widget中文示例指南」如何创建一个计算器?(三)

Qt 是目前最先进、最完整的跨平台C开发工具。它不仅完全实现了一次编写&#xff0c;所有平台无差别运行&#xff0c;更提供了几乎所有开发过程中需要用到的工具。如今&#xff0c;Qt已被运用于超过70个行业、数千家企业&#xff0c;支持数百万设备及应用。 本文将展示如何使用…

【开源GIS】如何高效地学习GIS开源项目?一上来就读源码你就输了!

目录 &#x1f525;前言Step 1: 熟悉项目Step 2: Hello worldStep 3: 深入了解和使用Step 4: 可以看源码了&#xff01;Step 5: API 二次封装Step 6: 持续关注和学习 &#x1f525;前言 都知开源好&#xff0c;只看源码看不懂&#xff0c;是俺太菜了&#xff1f;no no no&#…

kubeadm方式重置k8s集群

以kubeadm方式部署的k8s&#xff0c;当出现问题&#xff0c;排查解决的难度会非常大&#xff0c;如果是实验环境&#xff0c;直接进行集群重置即可&#xff0c;如果是生产环境&#xff0c;如果集群已经崩掉了&#xff0c;而且短时间时间内无法定位原因的情况的下&#xff0c;建…

Ansible(一)

Ansible: 远程操作主机功能&#xff1a; 自动化运维&#xff08;playbook剧本YAML&#xff09; 是基于Python开发的配置管理应用部署攻具&#xff0c;在自动化运维当中&#xff0c;现在是异军突起 Ansible能批量配置&#xff0c;部署&#xff0c;管理上千台主机&#xff0c…

基于vite 初始化vue3项目并引入Vue Router和Ant Design Vue

基于vite 初始化vue3项目并引入常用的功能、组件。 Vue RouterAnt Design Vue 系列文章指路&#x1f449; 系列文章-基于Vue3创建前端项目并引入、配置常用的库和工具类 文章目录 创建ViteVue项目创建并运行WebStorm无法识别&#xff0c;需要在vite.config.js中定义alias 引入…

GNSS模块在野外探险中的应用

野外探险是一项令人兴奋的活动&#xff0c;而GNSS&#xff08;全球导航卫星系统&#xff09;模块的广泛应用为探险者提供了精准的导航、位置跟踪和安全保障。本文将深入探讨GNSS模块在野外探险中的应用&#xff0c;以及它如何改变和增强探险体验。 精准导航与路径规划&#xf…

基于SpringBoot的大病保险管理系统 JAVA简易版

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 系统配置维护2.2 系统参保管理2.3 大病保险管理2.4 大病登记管理2.5 保险审核管理 三、系统详细设计3.1 系统整体配置功能设计3.2 大病人员模块设计3.3 大病保险模块设计3.4 大病登记模块设计3.5 保险审核模块设计 四、…

VS Code配置Go语言开发环境

提示&#xff1a;首先这是一个新型语言&#xff0c;最好把vscode更新到最新版。 1&#xff1a;去官网下载Go语言编译器&#xff0c;之后配置到系统环境中&#xff0c;能看到版本就行。 2&#xff1a;创建一个文件夹&#xff0c;存放go的工具文件&#xff0c;我的在D:\GoFile\G…

职场如何与不同级别的领导打交道?学会3个小妙招吃遍天下

职场如何与不同级别的领导打交道&#xff1f;学会3个小妙招吃遍天下 简介 刚步入职场的时候&#xff0c;很多新人小白会患上权威恐惧症&#xff0c;简单来说就是害怕与领导打交道&#xff0c;职位越大的领导越害怕。有领导在的地方有多远就躲多远&#xff0c;更别说主动去找领…