RISC-V基础之浮点指令(包含实例)

RISC-V体系结构定义了可选的浮点扩展,分别称为RVF、RVD和RVQ,用于操作单精度、双精度和四倍精度的浮点数。RVF/D/Q定义了32个浮点寄存器,f0到f31,它们的宽度分别为32位、64位或128位。当一个处理器实现了多个浮点扩展时,它使用浮点寄存器的低位部分来执行低精度的指令。f0到f31与程序(也称为整数)寄存器x0到x31是分开的。与程序寄存器一样,浮点寄存器也按照约定用于某些特定的目的

 

RISC-V的浮点指令分为以下几类:
- 浮点加载和存储指令:用来在内存和浮点寄存器之间传输浮点数。例如,FLW指令从内存加载一个单精度浮点数到浮点寄存器,FSW指令将一个单精度浮点数从浮点寄存器存储到内存。
- 浮点计算指令:用来在浮点寄存器之间进行浮点数的加、减、乘、除、平方根等运算。例如,FADD.S指令将两个单精度浮点数相加,FDIV.D指令将两个双精度浮点数相除。
- 浮点转换指令:用来在不同的浮点数格式或整数格式之间转换浮点数。例如,FCVT.S.D指令将一个双精度浮点数转换为一个单精度浮点数,FCVT.W.S指令将一个单精度浮点数转换为一个32位整数。
- 浮点比较指令:用来在浮点寄存器之间进行浮点数的相等、小于、小于等于等比较,并将布尔结果记录在整数寄存器中。例如,FEQ.S指令判断两个单精度浮点数是否相等,FLT.D指令判断两个双精度浮点数是否小于。
- 浮点移动指令:用来在整数寄存器和浮点寄存器之间传输数据,不改变数据的位模式。例如,FMV.X.W指令将一个单精度浮点数从浮点寄存器移动到整数寄存器,FMV.W.X指令将一个32位整数从整数寄存器移动到浮点寄存器。
- 浮点类别化指令:用来判断一个浮点数是否属于某个特定的类别,如正无穷、负无穷、非数字(NaN)等,并将布尔结果记录在整数寄存器中。例如,FCLASS.S指令将一个单精度浮点数的类别编码为一个12位的位向量,并放入整数寄存器。

```riscv
# RISC-V floating-point program to calculate pi
# using the Gregory-Leibniz series
# pi/4 = 1 - 1/3 + 1/5 - 1/7 + ...
# f0: the result (pi)
# f1: the current term
# f2: the denominator
# f3: the sign (-1 or 1)
# f4: the constant 4.0
# f5: the constant 1.0
# f6: the constant -1.0
# t0: the loop counter

.data
    n: .word 1000000 # number of terms to compute

.text
    # initialize registers
    flw f4, =4.0 # f4 = 4.0
    flw f5, =1.0 # f5 = 1.0
    flw f6, =-1.0 # f6 = -1.0
    fmv.s f0, f5 # f0 = 1.0 (result)
    fmv.s f1, f5 # f1 = 1.0 (term)
    fmv.s f2, f5 # f2 = 1.0 (denominator)
    fmv.s f3, f5 # f3 = 1.0 (sign)
    lw t0, n # t0 = n (loop counter)

loop:
    # update the result
    fsub.s f0, f0, f1 # f0 = f0 - f1

    # update the term
    fadd.s f2, f2, f4 # f2 = f2 + 4.0
    fdiv.s f1, f3, f2 # f1 = f3 / f2

    # update the sign
    fneg.s f3, f3 # f3 = -f3

    # update the loop counter
    addi t0, t0, -1 # t0 = t0 - 1

    # check the loop condition
    bnez t0, loop # if t0 != 0, go to loop

    # multiply the result by 4
    fmul.s f0, f0, f4 # f0 = f0 * 4.0

    # return the result in a0
    fcvt.w.s a0, f0 # a0 = (int)f0

这个程序示例是用RISC-V的单精度和双精度浮点指令来计算圆周率近似值的。它使用了Gregory-Leibniz级数,这一般项是(-1)^n / (2n+1),它的和等于pi/4。也就是说,pi/4 = 1 - 1/3 + 1/5 - 1/7 + …。这个程序使用了递归函数来计算这个级数的前n项的和,其中n是一个全局变量,可以在程序中修改。

 

它的功能是将数组中的每个元素加上10,并将结果存回数组中。它的主要步骤如下:

  • 首先,代码在s0寄存器中存放了数组scores的基地址,这个数组有200个元素,每个元素占4个字节。代码还在s1寄存器中初始化了一个循环计数器i为0,在t2寄存器中存放了一个循环终止条件200,在t3寄存器中存放了一个常数10,在ft0浮点寄存器中存放了一个单精度浮点数10.0。
  • 然后,代码进入一个for循环,每次循环都对数组中的一个元素进行操作。循环的条件是i < 200,如果不满足就跳转到done标签处结束程序。
  • 在循环体中,代码首先计算数组中第i个元素的地址,方法是将i左移2位(相当于乘以4),然后加上s0(基地址)。这个地址被保存在t3寄存器中。
  • 然后,代码使用flw指令从t3寄存器指向的内存地址加载一个单精度浮点数到ft1浮点寄存器中,这个浮点数就是scores[i]。
  • 接着,代码使用fadd.s指令将ft1和ft0两个浮点寄存器中的值相加,并将结果保存在ft1中。这相当于执行了scores[i] = scores[i] + 10.0。
  • 然后,代码使用fsw指令将ft1寄存器中的值存储到t3寄存器指向的内存地址中,这相当于将修改后的scores[i]写回数组中。
  • 最后,代码使用addi指令将s1寄存器(循环计数器i)加上1,并跳转到for标签处继续下一次循环。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/62922.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

GD32F103待机模式与唤醒

GD32F103待机模式与唤醒&#xff0c;本程序使用RTC报警唤醒。 电源管理单元有3种省电模式:睡眠模式,深度睡眠模式和待机模式&#xff1b; 进入待机模式的步骤如下&#xff1a; 若需要RTC闹钟输出&#xff0c;则需要将TAMPER-RTC映射到PC13引脚; 若需要LXTAL晶振32.768KHz&…

Go 语言面试题(一):基础语法

文章目录 Q1 和 : 的区别&#xff1f;Q2 指针的作用&#xff1f;Q3 Go 允许多个返回值吗&#xff1f;Q4 Go 有异常类型吗&#xff1f;Q5 什么是协程&#xff08;Goroutine&#xff09;Q6 如何高效地拼接字符串Q7 什么是 rune 类型Q8 如何判断 map 中是否包含某个 key &#xf…

Python高阶技巧 正则表达式

正则表达式&#xff0c;又称规则表达式&#xff08;Regular Expression&#xff09;&#xff0c;是使用单个字符串来描述、匹配某个句法规则的字符串&#xff0c;常被用来检索、替换那些符合某个模式&#xff08;规则&#xff09;的文本。 简单来说&#xff0c;正则表达式就是使…

Prometheus + Grafana安装

Prometheus是一款基于时序数据库的开源监控告警系统&#xff0c;非常适合Kubernetes集群的监控。Prometheus的基本原理是通过HTTP协议周期性抓取被监控组件的状态&#xff0c;任意组件只要提供对应的HTTP接口就可以接入监控。不需要任何SDK或者其他的集成过程。这样做非常适合做…

Ceph入门到精通-远程开发Windows下使用SSH密钥实现免密登陆Linux服务器

工具&#xff1a; win10、WinSCP 服务器生成ssh密钥&#xff1a; 打开终端&#xff0c;使账号密码登录&#xff0c;输入命令 ssh-keygen -t rsa Winscp下载 Downloading WinSCP-6.1.1-Setup.exe :: WinSCP window 生成密钥 打开powershell ssh-keygen -t rsa 注意路径 …

Day10-NodeJS和NPM配置

Day10-NodeJS和NPM 一 Nodejs 1 简介 Nodejs学习中文网:https://www.nodeapp.cn/synopsis.html Nodejs的官网:https://nodejs.org/ 概念:Nodejs是JavaScript的服务端运行环境.Nodejs不是框架,也不是编程语言,就是一个运行环境. Nodejs是基于chrome V8引擎开发的一套js代码…

【雕爷学编程】Arduino动手做(184)---快餐盒盖,极低成本搭建机器人实验平台2

吃完快餐粥&#xff0c;除了粥的味道不错之外&#xff0c;我对个快餐盒的圆盖子产生了兴趣&#xff0c;能否做个极低成本的简易机器人呢&#xff1f;也许只需要二十元左右 知识点&#xff1a;轮子&#xff08;wheel&#xff09; 中国词语。是用不同材料制成的圆形滚动物体。简…

Python以及Pycharm保姆级的下载安装教程,看完就懂

&#x1f973;&#x1f973;Welcome Huihuis Code World ! !&#x1f973;&#x1f973; 接下来看看由辉辉所写的关于Python的相关操作吧 目录 &#x1f973;&#x1f973;Welcome Huihuis Code World ! !&#x1f973;&#x1f973; 一.Python的安装 1.下载地址 2.下载步骤…

Netty+springboot开发即时通讯系统笔记(一)

业务部分从sql开始&#xff1a; /*Navicat Premium Data TransferSource Server : localhostSource Server Type : MySQLSource Server Version : 50740Source Host : localhost:3306Source Schema : im-coreTarget Server Type : MySQLTarge…

微信小程序的自定义TabBar及Vant的使用

一、安装Vant 1、在 资源管理器 空白位置&#xff0c;点右键打开 在外部终端窗口打开 2、初始化NPM npm init -y 3、安装命令 npm i vant/weapp1.3.3 -S --production 4、构建NPM包 在 工具 里选择构建NPM包 5、删除style:v2 在app.json里&#xff0c;删除"style"…

SpringBoot中使用Swagger详解

在Spring Boot中规范的使用Swagger进行接口测试 文章目录 Swagger是什么&#xff1f;为什么要用Swagger&#xff1f;准备工作创建项目编写接口验证 高级配置文档注释接口过滤自定义响应 SwaggerUI的使用遇到的问题&#xff1a; Swagger是什么&#xff1f; Swagger是一套基于Op…

黑马大数据学习笔记4-Hive部署和基本操作

目录 思考规划安装MySQL数据库修改root用户密码配置Hadoop下载解压Hive提供MySQL Driver包配置Hive初始化元数据库启动Hive&#xff08;使用Hadoop用户&#xff09;Hive体验HiveServer2HiveServer2服务启动 Beeline p48、51、52 https://www.bilibili.com/video/BV1WY4y197g7/?…

机器学习——SMO算法推导与实践

一、 硬间隔-SMO算法推导 明天再说&#xff0c;啊。。。。感觉天空明朗了很多&#xff0c;即使现在已经很晚了 还是要打开柯南&#xff0c;看看电视&#xff0c;等待天气预报所说的台风天吧&#xff01; 一时之间&#xff0c;忽然失去了用markdown语法写下推导过程的勇气。。。…

【Docker】Docker+Zipkin+Elasticsearch+Kibana部署分布式链路追踪

文章目录 1. 组件介绍2. 服务整合2.1. 前提&#xff1a;安装好Elaticsearch和Kibana2.2. 再整合Zipkin 点击跳转&#xff1a;Docker安装MySQL、Redis、RabbitMQ、Elasticsearch、Nacos等常见服务全套&#xff08;质量有保证&#xff0c;内容详情&#xff09; 本文主要讨论在Ela…

Typescript 枚举类型

枚举是用来表示一组明确的可选值列表 // enum是枚举类型的关键字 //枚举如果不设置值&#xff0c;默认从0开始 enum Direction {Up, // 0 Down, // 1 Left, // 2Right // 3} //如果给第一个值赋值为100&#xff0c;则第二、第三第四个都会在第一个的基础上1 分别是101,102…

算法通过村第二关-链表黄金笔记|K个一组反转

文章目录 前言链表反转|K个一组翻转链表解题方法&#xff1a;头插法处理&#xff1a;穿针引线法处理&#xff1a; 总结 前言 提示&#xff1a;没有人天生就喜欢一种气味而讨厌另一种气味。文明的暗示而已。 链表反转|K个一组翻转链表 给你链表的头节点 head &#xff0c;每 k…

基于自组织竞争网络的患者癌症发病预测(matlab代码)

1.案例背景 1.1自组织竞争网络概述 前面案例中讲述的都是在训练过程中采用有导师监督学习方式的神经网络模型。这种学习方式在训练过程中,需要预先给网络提供期望输出,根据期望输出来调整网络的权重,使得实际输出和期望输出尽可能地接近。但是在很多情况下,在人们认知的过程中…

Redis安装以及配置隧道连接(centOs)

目录 1.centOs安装Redis 2. Redis 启动和停⽌ 3. 操作Redis 2.Xshell配置隧道 1.centOs安装Redis #使⽤yum安装Redis yum -y install redis 2. Redis 启动和停⽌ #查看是否启动 ps -ef|grep redis#启动redis: redis-server /etc/redis.conf &#停⽌Redis redis-cli sh…

TabR:检索增强能否让深度学习在表格数据上超过梯度增强模型?

这是一篇7月新发布的论文&#xff0c;他提出了使用自然语言处理的检索增强Retrieval Augmented技术&#xff0c;目的是让深度学习在表格数据上超过梯度增强模型。 检索增强一直是NLP中研究的一个方向&#xff0c;但是引入了检索增强的表格深度学习模型在当前实现与非基于检索的…

Docker入门——保姆级

Docker概述 ​ —— Notes from WAX through KuangShen 准确来说&#xff0c;这是一篇学习笔记&#xff01;&#xff01;&#xff01; Docker为什么出现 一款产品&#xff1a;开发—上线 两套环境&#xff01;应用环境如何铜鼓&#xff1f; 开发 – 运维。避免“在我的电脑…