数组或结构体赋值时memcpy与直接赋值的效率比较

先上结论:

  • 二者不一定谁快
  • 通常情况下,数组维度越大,使用memcpy效率更高
  • 数组维度越大,直接赋值耗时主体是循环耗时

Note:

  1. “等号赋值”被编译器翻译成一连串的MOV指令,而memcpy则是一个循环。“等号赋值”比memcpy快,并不是快在拷贝方式上,而是快在程序流程上
  2. 连续的MOV指令要比循环MOV快
  3. 在循环方式下,每一次MOV过后,需要: ①判断是否拷贝完成;②跳转以便继续拷贝
  4. 循环除了增加了判断和跳转指令以外,对于CPU处理流水产生的影响也是不可不计的

转自传送门

如果是低维数组,直接展开循环进行赋值效率更高,这样可以避免判断与跳转对CPU时间的占用,也就是空间换时间,但要注意的是,并不是越展开越好(即使不考虑对空间的浪费),展开也应该有个度。

因为CPU的快速执行很依赖于cache,如果cache不命中,CPU将浪费不少的时钟周期在等待内存上(内存的速度一般比CPU低一个数量级)。而小段循环结构就比较有利于cache命中,因为重复执行的一段代码很容易被硬件放在cache中,这就是代码局部性带来的好处。而过度的循环展开就打破了代码的局部性。

GCC有自动将循环展开的编译选项,如-funroll-loops

测试代码见文末,下面分情况进行几个小实验。


1. 数组1维,对比memcpy与赋值

  • 无优化选项
    在这里插入图片描述
  • -O3编译
    在这里插入图片描述

2. 数组1000维,对比memcpy与赋值

  • 无优化选项
    在这里插入图片描述

  • -O3编译
    在这里插入图片描述

  • 屏蔽循环中的赋值,无优化选项
    在这里插入图片描述

  • 屏蔽循环中的赋值,-O3编译
    在这里插入图片描述


测试代码如下:

#include <stdio.h>
#include <sys/time.h>
#include <unistd.h>
#include <string.h>

#define DIMENSION_MIN 10
#define DIMENSION_MAX 200

int main()
{
	int count = 1000000;
	double data[DIMENSION_MIN] = {0};
	double bate[DIMENSION_MIN] = {0};
	
	struct timeval tv;
	double dT1=0,dT2=0;
	double start,stop;

	gettimeofday(&tv,NULL);
	start = (double)(tv.tv_sec*1000 + tv.tv_usec*0.001); //ms		
	for(int i=0;i<count;i++)
	{
		memcpy(bate,data,sizeof(bate));
	}
	gettimeofday(&tv,NULL);
	stop = (double)(tv.tv_sec*1000 + tv.tv_usec*0.001); //ms	
	dT1 = stop - start;

	gettimeofday(&tv,NULL);
	start = (double)(tv.tv_sec*1000 + tv.tv_usec*0.001); //ms		
	for(int i=0;i<count;i++)
	{
		for(int j=0;j<DIMENSION_MIN;j++)
		{
			bate[j]=data[j];
		}
	}
	gettimeofday(&tv,NULL);
	stop = (double)(tv.tv_sec*1000 + tv.tv_usec*0.001); //ms	
	dT2 = stop - start;
	
	printf("\n\n\n%d维数组的比较:\n",DIMENSION_MIN);
	printf("       for take time: %lfms\n",dT2);
	printf("    memcpy take time: %lfms\n\n\n",dT1);
	
	/***********************************************************************/

	double data1[DIMENSION_MAX] = {0};
	double bate1[DIMENSION_MAX] = {0};

	gettimeofday(&tv,NULL);
	start = (double)(tv.tv_sec*1000 + tv.tv_usec*0.001); //ms		
	for(int i=0;i<count;i++)
	{
		memcpy(bate1,data1,sizeof(bate));
	}
	gettimeofday(&tv,NULL);
	stop = (double)(tv.tv_sec*1000 + tv.tv_usec*0.001); //ms	
	dT1 = stop - start;

	gettimeofday(&tv,NULL);
	start = (double)(tv.tv_sec*1000 + tv.tv_usec*0.001); //ms		
	for(int i=0;i<count;i++)
	{
		for(int j=0;j<DIMENSION_MAX;j++)
		{
			bate1[j]=data1[j];
		}
	}
	gettimeofday(&tv,NULL);
	stop = (double)(tv.tv_sec*1000 + tv.tv_usec*0.001); //ms	
	dT2 = stop - start;
	
	printf("%d维数组的比较:\n",DIMENSION_MAX);
	printf("       for take time: %lfms\n",dT2);
	printf("    memcpy take time: %lfms\n\n\n",dT1);

	return 0;
}

参考文献:

  • https://blog.csdn.net/pngynghay/article/details/17142401
  • https://developer.aliyun.com/article/8924
  • https://www.zhihu.com/question/356017800/answer/2786064715

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/20441.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

深入解析PyTorch中的模型定义:原理、代码示例及应用

❤️觉得内容不错的话&#xff0c;欢迎点赞收藏加关注&#x1f60a;&#x1f60a;&#x1f60a;&#xff0c;后续会继续输入更多优质内容❤️ &#x1f449;有问题欢迎大家加关注私戳或者评论&#xff08;包括但不限于NLP算法相关&#xff0c;linux学习相关&#xff0c;读研读博…

【一起啃书】《机器学习》第六章 支持向量机

文章目录 第六章 支持向量机6.1 间隔和支持向量6.2 对偶问题6.3 核函数6.4 软间隔与正则化6.5 支持向量回归6.6 核方法6.7 一些问题 第六章 支持向量机 6.1 间隔和支持向量 给定训练样本集 D { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x m , y m ) } , y i ∈ { − 1 , …

Day 1 认识软件测试——(软件测试定义、目的、原则)

Day 1 认识软件测试——(软件测试定义、目的、原则) 文章目录 Day 1 认识软件测试——(软件测试定义、目的、原则)软件测试的定义软件测试的目的软件测试的经济学问题黑盒测试白盒测试软件测试原则小结所谓软件测试,就是一个过程或一系列过程,用来确定计算机代码完成了其…

《我命由我不由天》蔡志忠——笔记一

目录 简介 经典摘录 三岁决定一生 父母该什么时候放手 确定将来要成为什么 积极主动为目标而努力 叛逆是最伟大的创意 父亲给蔡志忠最大的影响是教会他两件事 价值观缺陷导致的后果 人有三个阶段 简介 作者 蔡志忠&#xff0c;李虹。 蔡志忠&#xff1a;漫画家、哲…

Vue加SpringBoot实现项目前后端分离

首先需要搭建一个Vue的脚手架项目&#xff08;已经放在gitee里面了&#xff0c;下面是gitee网址&#xff0c;可以直接拉&#xff09; (vue-web: 这个是Vue项目模板&#xff0c;没有后台数据) 那么接下来就是实现前后端分离的步骤 首先我们需要有一个登录页面 登录的点击事件利用…

图神经网络:(节点分类)在KarateClub数据集上动手实现图神经网络

文章说明&#xff1a; 1)参考资料&#xff1a;PYG官方文档。超链。 2)博主水平不高&#xff0c;如有错误还望批评指正。 3)我在百度网盘上传了这篇文章的jupyter notebook。超链。提取码8888。 文章目录 文献阅读&#xff1a;代码实操&#xff1a; 文献阅读&#xff1a; 参考文…

【Hello Algorithm】归并排序及其面试题

作者&#xff1a;小萌新 专栏&#xff1a;算法 作者简介&#xff1a;大二学生 希望能和大家一起进步 本篇博客简介&#xff1a;介绍归并排序和几道面试题 归并排序及其面试题 归并排序归并排序是什么归并排序的实际运用归并排序的迭代写法归并排序的时间复杂度 归并排序算法题小…

(十一)地理数据库创建——创建新的地理数据库

地理数据库创建——创建新的地理数据库 目录 地理数据库创建——创建新的地理数据库 1.地理数据库概述2.地理数据库建立一般过程2.1地理数据库设计2.2地理数据库建立2.2.1从头开始建立一个新的地理数据库2.2.2移植已经存在数据到地理数据库2.2.3用CASE工具建立地理数据库 2.3建…

Python 科研绘图可视化(后处理)Matplotlib - 2D彩图

Introduction 科研可视化是将数据和信息转化为可视化形式的过程&#xff0c;旨在通过图形化展示数据和信息&#xff0c;使得科研工作者能够更好地理解和分析数据&#xff0c;并从中发现新的知识和洞见。科研可视化可以应用于各种领域&#xff0c;如生物学、物理学、计算机科学…

C++类和对象再探

文章目录 const成员再谈构造函数成员变量的定义函数体内赋值初始化列表 隐式类型转换explicitstatic成员 const成员 我们知道在调用类的成员函数时,会有一个默认的this指针且这个this指针时不可以被修改的,例如在日期类中,会有隐式的Date * const this;注意这里默认会在this前…

一五一、web+小程序骨架屏整理

骨架屏介绍 请点击查看智能小程序骨架屏 车载小程序骨架屏 车载小程序为方便开发者设置骨架屏&#xff0c;在智能小程序的基础上抽取出骨架屏模板&#xff0c;开发者只需要在 skeleton 文件夹下配置config.json&#xff08;page 和骨架屏的映射关系文件&#xff09;即可生效骨…

第十四届蓝桥杯青少组模拟赛Python真题 (2022年11月8日)

第十四届蓝桥杯青少组模拟赛Python真题 (2022年11月8日) 编程题 第 1 题 问答题 二进制位数 十进制整数2在十进制中是1位数,在二进制中对应10,是2位数。 十进制整数22在十进制中是2位数,在二进制中对应10110,是5位数。 请问十进制整数2022在二进制中是几位数? 第2题问…

Pr 拍立得风格图片展示

哈喽&#xff0c;各位小伙伴&#xff01;今天我们来学习一下如何制作拍立得风格的照片展示效果&#xff1f; 新建三个序列 在开始之前&#xff0c;我们需要新建三个序列 序列1&#xff1a;总合成-尺寸1902*1080序列2&#xff1a;照片合成-尺寸1920*1080序列3&#xff1a;照片…

自动驾驶TPM技术杂谈 ———— I-vista验收标准(试验规程)

文章目录 术语介绍试验准备场地要求环境要求精度要求边界车辆&路沿石 试验方法能力试验双边界车辆平行车位白色标线平行车位双边界车辆垂直车位白色标线垂直车位方柱垂直车位双边界车辆斜向车位白色标线斜向车位 新功能评价平行车位远程操控泊入泊出试验垂直车位远程操控泊…

能伸展脖子的机器人?东京大学最新研究成果:基于鸵鸟肌肉骨骼结构和行为,具有高度灵活性的新型机械臂—RobOstrich(附论文)

原创 | 文 BFT机器人 得益于高度灵活的颈部&#xff0c;鸟类可以做很多事情&#xff0c;无论是转过头梳理自己的后背&#xff0c;在飞行过程中“眼观六路”&#xff0c;还是在地面或树上难以触及的角落和缝隙寻找食物。而在所有鸟类中&#xff0c;鸵鸟以其结实灵巧的颈部脱颖而…

​ NISP一级备考知识总结之信息安全概述、信息安全基础

参加每年的大学生网络安全精英赛通过初赛就可以嫖一张 nisp&#xff08;国家信息安全水平考试&#xff09; 一级证书&#xff0c;nisp 一级本身没啥考的价值&#xff0c;能白嫖自然很香 1.信息安全概述 信息与信息技术 信息概述 信息奠基人香农认为&#xff1a;信息是用来消…

【Linux】如何实现单机版QQ,来看进程间通信之管道

学会了管道&#xff0c;就可以实现简单的qq哦~ 文章目录 前言一、匿名管道总结 前言 为什么要进行进程间通信呢&#xff1f;因为需要以下这些事&#xff1a; 数据传输&#xff1a;一个进程需要将它的数据发送给另一个进程 资源共享&#xff1a;多个进程之间共享同样的资源。 …

ChatGPT实现旅行安排

工作之余&#xff0c;出门旅行一趟放松放松身心&#xff0c;是对自己辛勤工作最好的犒劳方式之一。旅行可以近郊游、可以远游&#xff0c;可以穷游&#xff0c;可以自驾游&#xff0c;可以一言不合打飞的喂鸽子&#xff0c;方式多种多样。但是多数情况&#xff0c;我们是到一个…

论文解析-基于 Unity3D 游戏人工智能的研究与应用

1.重写 AgentAction 方法 1.1 重写 AgentAction 方法 这段代码是一个重写了 AgentAction 方法的方法。以下是对每行代码解释&#xff1a; ①public override void AgentAction(float[] vectorAction) 这行代码声明了一个公共的、重写了父类的 AgentAction 方法的方法。它接受…

Java版本工程管理系统源码企业工程项目管理系统简介

一、立项管理 1、招标立项申请 功能点&#xff1a;招标类项目立项申请入口&#xff0c;用户可以保存为草稿&#xff0c;提交。 2、非招标立项申请 功能点&#xff1a;非招标立项申请入口、用户可以保存为草稿、提交。 3、采购立项列表 功能点&#xff1a;对草稿进行编辑&#x…