Arm AArch64 alignment(对齐)

数据和指令必须与合适的边界保持对齐(alignment)。访问是否对齐会影响ARM核的性能,并且在将代码从早期的体系结构移植到ARMv8-A时可能会出现可移植性问题。出于性能原因,或者在移植代码时,都值得去注意下对齐问题。本文将讲述了ARMv8-A AArch64的对齐。

一、指令对齐

指令对齐(Instruction alignment)比较简单,A64指令必须word对齐。如果从非对齐位置读取指令的话,会报PC对齐错误。

二、数据访问对齐(Alignment of data accesses)

数据访问对齐(Alignment of data accesses)稍微复杂点,取决于访问类型、地址属性、系统支持的特性和系统的配置等。

2.1 Device memory

Device memory可以分为多种,不过任何非对齐访问Device memory都会上报对齐错误。

2.2 Normal memory

对Normal memory的非对齐访问取决于以下所有条件:

  • 访问内存的指令类型;
  • 访问地址的内存属性;
  • SCTLR_ELx.{A, nAA}寄存器域段的值;
  • FEAT_LSE2是否实现;

以下可以分为几类指令来说:

1.对于Load or Store of Single or Multiple registers instructions,不包含exclusive,acquire/release,atomic和MCMS指令,如果访问的数据块与地址非对齐,那么:

  • 如果SCTLR_ELx.A==1,那么上报alignment fault。
  • 如果SCTLR_ELx.A==0,那么允许unaligned访问。但是访问是否保证single-copy atomic取决于地址属性和FEAT_LSE2是否实现。

2.对于Load-Exclusive/ Store-Exclusive and Atomic instructions,如果访问的数据块与地址非对齐,那么:

  • 如果SCTLR_ELx.A==1,那么上报alignment fault。
  • 如果SCTLR_ELx.A==0,那么是否允许访问取决于地址属性和FEAT_LSE2是否实现,如果允许访问,那么就算是非对齐,也要保证single-copy atomic。

3.对于Non-atomic and non-exclusive Load-Acquire/Store-Release instructions,如果访问的数据块与地址非对齐,那么:

  • 如果SCTLR_ELx.A==1,那么上报alignment fault。
  • 如果SCTLR_ELx.A==0,那么是否允许访问取决于地址属性和FEAT_LSE2是否实现,以及要看SCTLR_ELx.nAA的值。SCTLR_ELx.nAA决定了访问的数据块跨地址16-byte边界是否允许访问。

4. 对于Memory Copy and Memory Set instructions, 如果访问的数据块与地址非对齐,那么:

  • 无论SCTLR_ELx.A的值为多少,都会进行对齐检查,也就是会上报alignment fault。
  • 如果Xn不是16的倍数,也会上报alignment fault。
  • 如果Xd没有对齐到16的倍数,也会产生alignment fault。

三、总结

可以用下面的伪代码和指令归属类型来总结上述内容,就很容易明白了。

判断alignment fault伪代码:

指令归属类型:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/355466.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【AJAX】简单学习记录

文章目录 一、Ajax是什么?二、AJAX工作原理:三、如何实现ajax请求四、同步交互与异步交互总结发送请求有哪些方式/标签:Ajax实现方式: 一、Ajax是什么? AJAX Asynchronous JavaScript and XML(异步的 Java…

【竞技宝】LOL:Burdol剑魔打如入无人之境 LGD让一追二击败UP

北京时间2024年1月28日,英雄联盟LPL2024春季赛在昨天迎来第一周第六个比赛日,本日第二场比赛由LGD对阵UP。本场比赛双方前两局互相翻盘各取一胜,决胜局Burdol的剑魔后期团战能扛能打如入无人之境,最终LGD让一追二击败UP。以下是本…

docker 部署xxl-job

docker 部署xxl-job XXL-JOB github地址 https://github.com/xuxueli/xxl-job XXL-JOB 文档地址 https://www.xuxueli.com/xxl-job/ XXL-JOB是一个分布式任务调度平台,其核心设计目标是开发迅速、学习简单、轻量级、易扩展。现已开放源代码并接入多家公司线上产品…

算法设计与分析实验:堆排序与分治

目录 一、合并K个升序链表 1.1 采用堆排序的思路 1.2 采用优先队列的思路 1.3 采用分治的思路及具体测试 二、数据流中的中位数 ​编辑2.1 具体思路 2.2 代码实现 2.3 测试结果 三、数组中的第k个最大元素 3.1 采用分治思路 3.2 采用最小堆 四、 最小K个数 4.1 采用…

MySQL知识点总结(二)——explain执行计划、SQL优化

MySQL知识点总结(二)——explain执行计划、SQL优化 explain执行计划typepossible_keyskeysextra SQL优化SQL优化的流程SQL优化技巧范围查询优化排序优化分组查询优化distinct优化分页查询优化join关联查询优化排序分页 关联查询分组 关联查询 排序in与…

基于FFT + CNN - BiGRU-Attention 时域、频域特征注意力融合的电能质量扰动识别模型

目录 往期精彩内容: 引言 1 快速傅里叶变换FFT原理介绍 第一步,导入部分数据,扰动信号可视化 第二步,扰动信号经过FFT可视化 2 电能质量扰动数据的预处理 2.1 导入数据 第一步,按照公式模型生成单一信号 2.2 …

【Android Gradle 插件】Gradle 基础配置 ② ( Gradle 空白项目构建示例演示 )

一、Gradle 空白项目构建示例演示 在任意一个空白目录 , 创建 build.gradle 构建脚本 , 该脚本是 Gradle 构建的入口 ; 在顶级目录和每个子工程 , 都要有单独的 build.gradle 构建脚本 ; 在 上述 build.gradle 构建脚本中添加如下代码 : println "Hello Gradle !"…

【IM】如何保证消息可用性(一)

目录 1. 基本概念1.1 长连接 和 短连接1.2 PUSH模式和PULL模式 2. 背景介绍2.1 理解端到端的思想 3. 方案选型3.1 技术挑战3.2 技术目标 1. 基本概念 在讲解消息可用性之前,需要理解几个通信领域的基本概念。 1.1 长连接 和 短连接 什么是长连接,短连接…

《幻兽帕鲁》火遍全球,上百个游戏角色竟被曝是AI生成的?

原创 | 文 BFT机器人 最近,一款名为《幻兽帕鲁》(Palworld)的开放世界生存游戏在社交网络平台上引发了热议,成为了当下最受关注的游戏之一。 这款游戏在1月19日于Steam平台上线抢先体验版本,仅仅24小时之内&#xff0…

2024.1.29每日一题

LeetCode 自由之路 自由之路通向自由,通向睡觉吧😄 514. 自由之路 - 力扣(LeetCode) 题目描述 电子游戏“辐射4”中,任务 “通向自由” 要求玩家到达名为 “Freedom Trail Ring” 的金属表盘,并使用表盘…

K8s 安装部署-Master和Minion(Node)

K8s 安装部署-Master和Minion(Node) 操作系统版本:CentOS 7.4 Master :172.20.26.167 Minion-1:172.20.26.198 Minion-2:172.20.26.210(后增加节点) ETCD:172.20.27.218 先安装部署ETCD y…

[论文阅读] |RAG评估_Retrieval-Augmented Generation Benchmark

写在前面 检索增强能够有效缓解大模型存在幻觉和知识时效性不足的问题,RAG通常包括文本切分、向量化入库、检索召回和答案生成等基本步骤。近期组里正在探索如何对RAG完整链路进行评估,辅助阶段性优化工作。上周先对评估综述进行了初步的扫描&#xff0…

Python 使用重构重命名一键更改变量名的方法

一个变量有多处引用的情况下,需要重命名,可以使用重构重命名进行一键更改。 方法是:选择变量名–>右键–>Refactor–>Rename(也可以使用快捷:选择变量后按下ShiftF6),然后直接输入新的变量名即可…

基于springboot游戏分享网站源码和论文

网络的广泛应用给生活带来了十分的便利。所以把游戏分享管理与现在网络相结合,利用java技术建设游戏分享网站,实现游戏分享的信息化。则对于进一步提高游戏分享管理发展,丰富游戏分享管理经验能起到不少的促进作用。 游戏分享网站能够通过互…

邻接矩阵、关联矩阵

邻接矩阵: 邻接矩阵是一种用来表示图中顶点间相互连接关系的矩阵。在邻接矩阵中,矩阵的行和列都代表图中的顶点。 对于无权图,如果顶点 i 和顶点 j 之间有一条边,则矩阵中的元素 Aij​(位于第 i 行和第 j 列&#xff…

3338 蓝桥杯 wyz的数组IV 简单

3338 蓝桥杯 wyz的数组IV 简单 //C风格解法1&#xff0c;通过率50% #include<bits/stdc.h>int main(){std::ios::sync_with_stdio(false);std::cin.tie(nullptr);std::cout.tie(nullptr);int n; std::cin >> n;int ans 0;std::vector<int>a(n);for(auto &am…

基于Java SSM框架实现家政服务中介网系统项目【项目源码+论文说明】

基于java的SSM框架实现家政服务中介网系统演示 摘要 21世纪的今天&#xff0c;随着社会的不断发展与进步&#xff0c;人们对于信息科学化的认识&#xff0c;已由低层次向高层次发展&#xff0c;由原来的感性认识向理性认识提高&#xff0c;管理工作的重要性已逐渐被人们所认识…

【Git配置代理】Failed to connect to github.com port 443 问题解决方法

前言&#xff1a; 在学习代码审计时&#xff0c;有时会需要使用git去拉取代码&#xff0c;然后就出现了如下错误 看过网上很多解决方法&#xff0c;觉得问题的关键还是因为命令行在拉取/推送代码时并没有使用VPN进行代理。 解决办法 &#xff1a; 配置http代理&#xff1a;…

DOM 型 XSS 攻击演示(附链接)

一、介绍 DOM&#xff08;Document Object Model&#xff09;型 XSS&#xff08;Cross-Site Scripting&#xff09;攻击是一种 Web 应用程序中的安全漏洞&#xff0c;其特点是攻击者成功地注入了恶意脚本&#xff0c;这些脚本在用户的浏览器中执行&#xff0c;从而导致恶意行为…