结构冒险,控制冒险,数据冒险实例分析

目录

1.结构冒险:

2.数据冒险:

3.控制冒险:


 指令执行过程:

取指(IF):从指令存储器或 Cache 中取指令。
译码/读寄存器(ID):操作控制器对指令进行译码,同时从寄存器堆中取操作数。
执行/计算地址(EX):执行运算操作或计算地址。

访存(MEM):对存储器进行读/写操作。

写回(WB):将指令执行结果写回寄存器堆。

1.结构冒险:

由不同指令在同一时刻争用同一功能部件而形成的冲突,也称资源冲突,即由硬件资源竞争造成的冲突。

解决方法:

(1)前一指令访存时,使后一条相关指令及其后续指令暂停一个时钟周期。

例题:

指令和数据通常都存放在同一存储器中,在第4个时钟周期,第 i 条LOAD指令进入 MEM 段时,第i+3条指令的 IF 段也要访存取指令,此时会发生访存冲突。所以,在前一条指令访存时,暂停(一个时钟周期)取后一条指令的操作。

:如果第i条指令不是LOAD 指令,在 MEM 段不访存,也就不会发生访存冲突。

(2)设置多个独立的部件。例如,对于寄存器访问冲突,可将寄存器的读口和写口独立开来;对于访存冲突,单独设置数据存储器和指令存储器。在现代Cache机制中,L1级 Cache通常采用数据Cache和指令Cache 分离的方式,从而也就避免了资源冲突的发生。

2.数据冒险:

数据冒险也称数据相关。引起数据冒险的原因是,后面指令用到前面指令的结果时,前面指令的结果还没有产生。在以非乱序执行的流水线中,所有数据冒险都是由于前面指令写结果之前,后面指令就需要读取而造成的,这种数据冒险称写后读(Read After Write,RAW)冲突。

补充:与非乱序执行的流水线相对应的是超标量流水线,其指令可以不按顺序执行,即乱序执行,不熟悉的可以看看这篇:

指令流水线

例如:

解决方法:

(1)延迟执行相关指令。把遇到数据相关的指令及其后续指令都暂停一至几个时钟周期,直到数据相关问题消失后再继续执行,可分为软件插入空操作“nop”指令和硬件阻塞(stall)两种方法。

对于上面的"写后读"冲突,可以暂停sub指令3个时钟周期,直至前面 add 指令的结果生成。

当然也可以,取指操作先做:

对于I1和 I2的数据相关问题,还可以通过将寄存器的写口和读口分别控制在前、后半个时钟周期内操作,使前半周期写入R1的值在后半周期马上被读出,在一个周期内读/写寄在器不会生冲突,这样I1的 WB段和I2 的ID段就可重叠执行,从而只需延迟2个时钟周期。

(2)设置相关转发通路,不等前一条指令把计算结果写回寄存器,下一条指令也不再从寄存器读。而将数据通路中生成的中间数据直接转发到 ALU 的输入端,也就是直接从EX/MEM流水寄存器中取操作数到ALU输入端进行运算。所以下图所示,add的“EX”操作后,紧接为sub的"EX"操作。

但是load指令与其后的运算类指令存在数据相关问题,则无法通过转发技术来解决。

例如:

I2         load r2,12(r1)        #M[ (r1)+I2]--->(r2)

I3         add r4 r3,r2           #(r3)+(r2)--->(r4)

load 指令只有在 MEM 段结束时才能得到主存中的结果,然后送 MEM/WB 流水段寄存器,在 WB 段的前半周期才能存入R2的新值,但随后的 add 指令在 EX 阶段就要取 R2 的值,因此,得到的是旧值。(这里假设用了转发技术)

对于 load-use 数据冒险,最简单的做法是由编译器在add指令之前插入一条 nop指令,这样在 add 指令的 EX 段就可以从 MEM/WB 流水段寄存器中取出 load 指令的最新结果,当然,最好的办法还是在程序编译时进行优化,通过调整指令顺序以避免出现load-use观象。

例题1:

下列指令序列中,指令 I1 和 I3、I2 和 I3 之间发生数据相关。假定采用“取指、译码、取数、执行、访存,写回”五段流水线方式,那么在采用转发技术时,需要在指令I3之前加入( )条空操作指令才能使这段程序不发生数据冒险。

I1: add r1,r0, 1        #(r1)<--- (r0)+ 1

I2: load r3,12(r2)        #(r3)<--- M[(r2) + 12]

I3: add r5,r3,r1        # (r5)<--- (r3)+(r1)

A. 3        B.2        C.0        D.1

答案:D

不发生任何流水线阻塞的执行顺序如下:

由于采用了转发技术,所以I3只要在I1的"EX"后执行取数操作即可,因为转发技术就是直接从EX/MEM流水段寄存器取值。所以 I3 与 I1 之间解决了“数据冒险”。

load 指令只在MEM段结束时才能取到主存中的数据,然后送MEM/WB 流水段寄存器,在WB段的前半周期才能将新值写入r3,但随后的add指令在EX阶段就要取r3的值了,因此会发生数据冒险。

在add前插入一条空操作指令就行:

例题2:

在采用“取指、译码/取数、执行、访存、写回”5段流水线的处理器中,执行如下指令序列,其中 s0、s1、s2、s3 和t2表示寄存器编号。

I1:add s2,s1,s0        //R[s2]<---R[s1]+R[s0]

I2:load s3,0(t2)        //R[s3]<---M[ R[t2]+0 ]

I3:add s2,s2,s3        //R[s2]<---R[s2]+R[s3]

I4:store s2,0(t2)       //M[R[t2]+0]<---R[s2]

下列指令对中,不存在数据冒险的是()。

A.I1和I3        B.I2和I3        C.I2和I4        D.I3和I4

答案:C

注:这里没有用到转发技术

对于A,B:

I3 的add指令要取 I1 的s2和 I2 的s3,需要等到两者的WB(写回)都结束才可以取操作数(ID),所以会发生“写后读”冲突。

 对于D:

I4的store指令要用到I3的结果s2,所以只有在 I3 的WB(写回)后,才可以取操作数。

3.控制冒险:

指令通常是顺序执行的,但当遇到改变指令执行顺序的情况,例如执行转移或返回指令、发生中断或异常时,会改变PC值,从而造成断流,也称控制冲突。

解决方法:

(1)对于由转移指令引起的冲突,可采用和解决数据冲突相同的软件插入“nop”指令和硬件阻塞(stall)的方法。通常把因流水线阻塞带来的延迟时钟周期数称为延迟损失时间片(C)

I1        loop:add Rl,R1,1        #(R1)+1→R1

I2        bne Rl,R2,loop          #if(R1)!=(R2) goto loop

假设R2存放常数N,R1的初值为1,bne 指令在 EX 段通过计算设置条件码,并在 MEM 段确定是否将PC 值更新为转移目的地址,因此仅当bne指令执行到第5个时钟结束时才能将转移目标地址送PC。为此,在数据通路检测到分支指令后,可以在分支指令后插入C(C=3)条nop指令。

(2)对转移指令进行分支预测,尽早生成转移目标地址。分支预测分为简单(静态)预测和动态预测。

① 静态预测假定分支总是不发生或者总是发生,每次预测结果是一样的。若静态预测的条件总是不满足,则按序继续执行分支指令的后续指令。

② 动态预测根据程序转移的历史情况,进行动态预测调整,根据局部性原理,其预测成功率通常比静态预测技术高。预测错误时,已被错误放入流水线执行的指令必须被舍弃。

例题:

在采用“取指、译码/取数、执行、访存、写回”5 段流水线的 RISC处理器中,执行如下指令序列(第一列为指令序号),其中s0、s1、s2、s3 和t2表示寄存器编号。

若采用转发(旁路)技术处理数据冒险,采用硬件阻塞方式处理控制冒险,则在指令I1~I4的执行过程中,发生流水线阻塞的指令有()

A. 仅I3        B.仅I2、I4        C仅I3、I4        D、仅I2、I3、I4

答案:C

① I2 和 I1 之间存在数据冒险,但是I1在EX段结束时就已生成R[s2]的新值,并存放在EX/MEM 流水段寄存器中,采用转发技术后,可直接从该寄存器中取出数据送到 ALU 的输入端,这样 I2 执行时 ALU用的是 R[s2] 的新值,解决了I2和 I1 之间的数据冒险。

② I3 和 I2 之间存在数据冒险,属于 load-use 数据冒险,用转发电路无法解决 I3 和 12 的数据相关问题,原因在于 load指令 是从内存中取数,只有在 Mem 段结束时才能从主存中得到R[s3]的新值,但3的 EX 段就要用到R[s3],因此无法用转发技术解决。I3 仍需阻塞一个时钟周期,等到12的 Mem 段结束后,从I2的 Mem/WB流水段寄存器中取到 R[s3]的新值。

③ I4和I3之间存在控制冒险,beq 指令在 Ex段设置条件码,在Mem 段控制是否将转移地址送到PC,这之后才能开始根据PC内容取指令,因此I4需要进行硬件阻塞。

总结:

1.结构冒险:

load指令MEM段的访存与后面指令的IF取指(取指访存)冲突,后面指令暂停一个时钟周期。

2.数据冒险:

① 后面指令需等前面指令写回才能进行译码(ID)

② 如果用了转发技术,则可以从EX/MEM流水段寄存器取值到ALU输入端,从而解决数据冒险

③ 对于load-use数据冒险,需要等待前一条指令的"MEM"结束后,后面指令的“EX”才能到MEM/WB流水段寄存器取值

3.控制冒险:

取指操作中,转移指令的下一条指令,需要在转移指令的"MEM"之后,才能进行取指(IF)操作。因为只有在MEM段才能确定,是将转移目标地址(满足转移条件)送入PC,根据PC内容取指令。还是取"PC+1"的指令(不满足转移条件)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/748275.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

获取个人免费版Ubuntu Pro

首先上官网地址&#xff1a;Ubuntu Pro | Ubuntu 点击页面中的"Get Ubuntu Pro now" 将用途选为“Myself”&#xff0c;在此页面中Ubuntu说明了该版本只面向个人开发者&#xff0c;且最终只允许5台设备免费使用&#xff1b;因而部署设备的抉择就不得不慎重考虑了&am…

39 - 安全技术与防火墙

39、安全技术和防火墙 一、安全技术 入侵检测系统&#xff1a;特点是不阻断网络访问&#xff0c;主要是提供报警和事后监督。不主动介入&#xff0c;默默看着你&#xff08;监控&#xff09;。 入侵防御系统&#xff1a;透明模式工作&#xff0c;数据包&#xff0c;网络监控…

Linux常见操作问题

1、登录刚创建的用户&#xff0c;无法操作。 注&#xff1a;etc/passwd文件是Linux操作系统中存储用户账户信息的文本文件&#xff0c;包含了系统中所有用户的基本信息&#xff0c;比如用户名、用户ID、用户组ID、用户家目录路径。 注&#xff1a;etc: 这个目录存放所有的系统…

Linux 命令:iftop

1. 写在前面 本文主要介绍 Linux iftop&#xff08;Interface TOP&#xff09; 命令&#xff1a;iftop 是一款小巧、免费且功能强大的网卡实时流量监控工具。监控指定网卡的实时流量、端口连接信息、反向解析 IP 等&#xff0c;还可以精确显示本机网络流量及网络内各主机和本机…

记录待办事项的便签软件哪个好用?

在快节奏的现代生活中&#xff0c;我们经常需要处理各种各样的待办事项&#xff0c;为了更好地管理时间&#xff0c;许多人选择使用便签软件来记录自己的待办事项。那么&#xff0c;记录待办事项的便签软件哪个好用&#xff1f;市面上众多的便签软件中&#xff0c;哪一个才是最…

HashMap第5讲——resize方法扩容源码分析及细节

put方法的源码和相关的细节已经介绍完了&#xff0c;下面我们进入扩容功能的讲解。 一、为什么需要扩容 这个也比较好理解。假设现在HashMap里的元素已经很多了&#xff0c;但是链化比较严重&#xff0c;即便树化了&#xff0c;查询效率也是O(logN)&#xff0c;肯定没有O(1)好…

Proxmox VE(PVE)上手配置指南

Proxmox VE&#xff08;PVE&#xff09;是一款开源虚拟化管理平台&#xff0c;集成了KVM和LXC技术&#xff0c;支持虚拟机和容器管理。它提供了一个基于Web的用户界面&#xff0c;支持高可用性集群、备份和恢复、实时迁移等功能&#xff0c;适用于企业级虚拟化环境。. 以下为安…

安装GroudingDINO RuntimeError: Error compiling objects for extension,如何解决?

&#x1f3c6;本文收录于「Bug调优」专栏&#xff0c;主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案&#xff0c;希望能够助你一臂之力&#xff0c;帮你早日登顶实现财富自由&#x1f680;&#xff1b;同时&#xff0c;欢迎大家关注&&收藏&&…

VCS编译bug汇总

‘typedef’ is not expected to be used in this contex 注册前少了分号。 Scope resolution error resolution : 声明指针时 不能与类名同名&#xff0c;即 不能声明为adapter. cannot find member "type_id" 忘记注册了 拼接运算符使用 关键要加上1b&#xff0…

opencascade AIS_InteractiveContext源码学习6 management of active Selection Modes

AIS_InteractiveContext 前言 交互上下文&#xff08;Interactive Context&#xff09;允许您在一个或多个视图器中管理交互对象的图形行为和选择。类方法使这一操作非常透明。需要记住的是&#xff0c;对于已经被交互上下文识别的交互对象&#xff0c;必须使用上下文方法进行…

计算机网络期末复习(大题+小题)

计算机网络期末复习 一、计算机网络概述 Point 1 计算机网络就是以传输信息为基本目的&#xff0c;用通信线路和通信设备将多个计算机连接起来的计算机系统的集合。由自治的计算机互联起来的结合体。 Point 2 按网络的覆盖范围进行分类 &#xff08;1&#xff09;局域网*…

海富泰可直动式比例阀控制器EVRD-03C26SB-C1D24-B00

控制EVOTEK海富泰可直动式及先导式比例方向阀EVRD-03A04SA-C1D24-V00、EVRD-03C08SB-C1D24-B00、EVRD-03A16SA-C1D24-V00、EVRD-03C26SB-C1D24-B00、EVRD-05A30SA-C1D24-V00、EVRD-05C60SB-C1D24-B00、EVRD-P05A80SA-IIC1D24-B00、EVRD-P07C100SB-EEC1D24-V00、EVRD-P07A150SA-…

Appium+python自动化(二十八)- 滑呀滑,滑到奈何桥喝碗孟婆汤 - 高级滑动(超详解)

简介   奈何桥上叹奈何&#xff0c;三生石前憾三生&#xff0c;彼岸花下非彼岸&#xff0c;奈何三生彼岸人。 相传过了鬼门关便上一条路叫黄泉路&#xff0c;路上盛开着只见花&#xff0c;不见叶的彼岸花。花叶生生两不见&#xff0c;相念相惜永相失&#xff0c;路尽头有一条…

JAVA医院绩效考核系统源码:绩效考核的重要性、绩效管理分配实践具体实操,基于B/S架构开发的一套(公立医院绩效考核系统源码)

JAVA医院绩效考核系统源码&#xff1a;绩效考核的重要性、绩效管理分配实践具体实操&#xff0c;基于B/S架构开发的一套&#xff08;公立医院绩效考核系统源码&#xff09; 系统开发环境 开发语言&#xff1a;java 技术架构&#xff1a;B/S架构 开发工具&#xff1a;maven、…

LeetCode 算法:验证二叉搜索树 c++

原题链接&#x1f517;&#xff1a;验证二叉搜索树 难度&#xff1a;中等⭐️⭐️ 题目 给你一个二叉树的根节点 root &#xff0c;判断其是否是一个有效的二叉搜索树。 有效 二叉搜索树定义如下&#xff1a; 节点的左 子树 只包含 小于 当前节点的数。节点的右子树只包含 大于…

锐起RDV5高性能云桌面

锐起是上海锐起信息技术有限公司旗下品牌。该公司创立于 2001 年&#xff0c;是桌面虚拟化产品和解决方案提供商&#xff0c;专注于桌面管理系统和私有云存储系统的系列软件产品研发&#xff0c;致力于简化 IT 管理、增强系统安全&#xff0c;提供简单、易用、稳定、安全的产品…

DockerDesktop中mysql容器无法使用Exec窗口解决

解决前 需要登陆&#xff1a; 登陆后需要升级才能启动调试模式 需要订阅才能使用 解决后&#xff1a; 正常使用 解决方法&#xff1a; 不要在DockerDesktop中启动mysql容器&#xff0c;使用命令行启动 启动命令 docker run --name mysql_docker -e MYSQL_ROOT_PASSWORD12345…

【单片机毕业设计选题24030】-基于STM32的智能鱼缸设计

系统功能: 采用STM32最小系统板控制&#xff0c;采集传感器数据显示在OLED上 并通过继电器进行相应的操作。 系统操作说明&#xff1a; 上电后OLED显示 “欢迎使用智能鱼缸系统请稍后”&#xff0c;两秒后进入第一页面显示。 第一页面第一行显示“系统状态监测”&#xff…

阀门盘根的介绍

盘根&#xff08;编制盘根&#xff09;&#xff08;packing&#xff09;也叫密封填料&#xff0c;通常由较柔软的线状物编织而成&#xff0c;通常截面积是正方形或长方形、圆形的条状物填充在密封腔体内,从而实现密封。填料密封最早是以棉麻等纤维塞在泄漏通道内来阻止液流泄漏…

不是KVM不支持精简置备的磁盘,而是VMM

正文共&#xff1a;999 字 11 图&#xff0c;预估阅读时间&#xff1a;1 分钟 书接上文&#xff08;不会吧&#xff01;KVM竟然不支持磁盘的精简置备&#xff01;&#xff1f;&#xff09;&#xff0c;我们已经掌握了通过“虚拟系统管理器VMM”创建虚拟机的基本方法&#xff0c…