计算机组成原理——输入/输出系统(十七)

人生最暗的夜,恰是抬头可见星辰的时刻。那些让你喘不过气的压力,是蜕变的茧房;那些被汗水浸透的清晨,终将化作破晓的光。不必羡慕他人的花开,你的根系正穿透岩层汲取力量,正如深海中的微光总在无人处酝酿璀璨。奔跑时不必害怕摔倒,因为真正定义你的,从来不是脚下踉跄的沙砾,而是眼中始终燃烧的远方。记住:没有一座高山拒绝攀登者的脚步,正如黎明永远不会辜负彻夜执灯的人——你的故事,正在翻越山脊的途中写成史诗。

计算机组成原理资源网

https://www.wenjingketang.com/这里面有ppt课后习题及答案,需要的可以自行下载

目录

9.4 DMA方式

9.4.1 DMA基本概念

定义与特点

与传统传输对比

9.4.2 DMA传送方式

1. 单字节传输模式

2. 块传输模式

3. 请求传输模式

9.4.3 基本DMA控制器

核心组件

工作流程(时序图描述)

9.4.4 DMA控制器类型

1. 独立DMA控制器(如8237A)

2. 集成DMA控制器

3. 多通道DMA

9.5 通道方式和I/O处理机方式

9.5.1 通道方式

通道结构体系

通道程序示例

执行过程

9.5.2 I/O处理机方式

架构演进

Intel I/O处理器示例

典型应用场景

关键技术对比表

代码案例详解

DMA内存到外设传输(Linux驱动示例)

总结与展望


9.4 DMA方式

9.4.1 DMA基本概念

定义与特点

DMA(Direct Memory Access)是一种无需CPU参与的数据传输技术,特点:

  • 传输速率高:可达数GB/s
  • 节省CPU资源:CPU仅需初始化传输,无需处理每个字节
  • 适用场景:高速设备(磁盘、网卡、显卡)的批量数据传输

与传统传输对比

传输方式CPU参与度适用场景典型速率
程序控制100%低速设备<1MB/s
中断驱动50-80%中速设备1-10MB/s
DMA<5%高速设备100MB/s - 10GB/s

9.4.2 DMA传送方式

1. 单字节传输模式

C

// 伪代码示例
void dma_transfer_single(void* src, void* dest, int size) {
    dma_init(src, dest, size);
    while(!dma_check_complete()) {
        // 等待每次传输完成中断
        // CPU可执行其他任务
    }
}

特点:

  • 每次传输1字节后释放总线
  • 总线占用率高但延迟低

2. 块传输模式

ASSEMBLY

; 汇编示例(x86)
mov DX, DMA_MODE_REG   ; 设置块传输模式
mov AL, BLOCK_MODE_CODE
out DX, AL

特点:

  • 连续传输整个数据块
  • 总线独占直至传输完成
  • 适合大数据量传输

3. 请求传输模式

工作流程:

  1. 设备发出DREQ请求
  2. DMA接管总线
  3. 传输直至:
    • 数据块传输完成
    • 外部EOP信号
    • DREQ失效

9.4.3 基本DMA控制器

核心组件

寄存器位宽功能描述
地址寄存器32/64位存储内存起始地址
计数寄存器16/32位记录剩余传输字节数
控制寄存器8/16位设置传输方向、模式等参数

工作流程(时序图描述)

  1. CPU初始化DMA参数
  2. 外设发起传输请求(DREQ)
  3. DMA向CPU申请总线(HRQ)
  4. CPU响应后进入HLDA状态
  5. DMA执行数据传输
  6. 传输完成发送中断信号

9.4.4 DMA控制器类型

1. 独立DMA控制器(如8237A)

引脚配置示例:

引脚  功能
HRQ  总线请求
HLDA 总线应答
DREQ0-3 设备请求线
DACK0-3 设备应答线

2. 集成DMA控制器

现代SoC典型配置:

C

// ARM Cortex-M DMA结构体
typedef struct {
    __IO uint32_t CCR;     // 配置寄存器
    __IO uint32_t CNDTR;   // 数据数量寄存器
    __IO uint32_t CPAR;    // 外设地址
    __IO uint32_t CMAR;    // 内存地址
} DMA_Channel_TypeDef;

3. 多通道DMA

通道优先级处理算法:

  1. 固定优先级
  2. 循环优先级
  3. 带宽加权分配

9.5 通道方式和I/O处理机方式

9.5.1 通道方式

通道结构体系

CPU → I/O通道 → 设备控制器 → 外设

通道类型对比:

类型并行能力适用场景
选择通道单设备高速设备(磁带机)
多路通道多设备中速设备群
数组多路通道分时复用磁盘阵列

通道程序示例

; IBM通道命令字(CCW)
CCW1: 02 000000 80 000050 ; 读操作,数据地址000000,长度80
CCW2: 08 000000 00 000000 ; 控制命令,结束链

执行过程

  1. CPU发出START IO指令
  2. 通道获取CCW链
  3. 执行通道程序
  4. 通过CSW(通道状态字)报告结果

9.5.2 I/O处理机方式

架构演进

传统:CPU → 设备控制器
DMA: CPU → DMA → 设备
通道:CPU → 通道 → 设备
IOP: 独立I/O处理机

Intel I/O处理器示例

C

// 数据搬运任务描述符
struct iop_task {
    uint32_t src_addr;
    uint32_t dest_addr;
    uint32_t length;
    uint32_t control; // 加密/校验使能位
    struct iop_task* next;
};

// 提交任务
void iop_submit(struct iop_task* task) {
    memory_barrier();
    *IOP_QUEUE_TAIL = task;
}

典型应用场景

  1. RAID控制器:硬件级数据条带化
  2. 网络处理器:TCP/IP协议栈卸载
  3. GPU:图形流水线处理

关键技术对比表

特性DMA通道方式I/O处理机
智能化程度低(需CPU配置)中(执行通道程序)高(完整指令集)
最大传输速率10GB/s2GB/s100GB/s+
典型延迟1-10μs5-50μs0.1-1μs
多任务支持多通道分时通道程序控制多核并行处理
编程复杂度
成本$0.1-1$1-10$10-100+

代码案例详解

DMA内存到外设传输(Linux驱动示例)

C

#include <linux/dma-mapping.h>

dma_addr_t dma_handle;
void* buffer = dma_alloc_coherent(dev, size, &dma_handle, GFP_KERNEL);

struct dma_device *dma_dev = filter->dma_chan->device;
struct dma_async_tx_descriptor *tx_desc;

tx_desc = dma_dev->device_prep_dma_memcpy(
    dma_chan, 
    dest_addr, 
    src_addr, 
    size, 
    DMA_CTRL_ACK);

dma_cookie_t cookie = dmaengine_submit(tx_desc);
dma_async_issue_pending(dma_chan);


总结与展望

未来发展趋势:

  1. CXL协议下的DMA新形态
  2. 智能网卡中的可编程I/O引擎
  3. 存算一体架构中的DMA优化

关键技术挑战:

  • 安全防护(DMA攻击防范)
  • 缓存一致性维护
  • 异构计算资源调度

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/973797.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Plant Simulation培训教程-双深堆垛机立库仿真模块

原创 知行 天理智能科技 2025年01月03日 17:02 浙江 又到年终盘点的时候了&#xff0c;在这里我把之前录制的Plant Simulation培训教程-双深堆垛机立库仿真模块分享出来&#xff0c;有需要的可以直接联系我。 双深堆垛机立库仿真模块基于单深模块开发&#xff0c;适用于双深堆…

Scala基础学习

主要用来处理数据&#xff0c;不处理web&#xff0c;没有类似spring的框架 1. Scala简介 我们基于的scala版本 2.12.10 scala是运行在 JVM 上的多范式&#xff08;规范&#xff09;编程语言&#xff0c;同时支持面向对象和面向函数编程。&#xff08;真实数据与操作过程解耦…

Java函数式编程-Lambda表达式 (形参)->{方法体}

函数式编程 此“函数”类似于数学中的函数(强调做什么)&#xff0c;只要输入的数据一致返回的结果也是一致的 函数式编程解决了什么问题&#xff1f; 使用Lambda函数替代某些匿名内部类对象&#xff0c;从而让程序代码更简洁&#xff0c;可读性更好。 Lambda表达式 (形参…

8.python文件

文章目录 1.**文件**1.1**文件是什么**1.2**文件路径**1.3**文件操作**1.3.1**打开文件**1.3.2**关闭文件**1.3.3**写文件**1.3.4**读文件** 1.4**关于中文的处理**1.5**使用上下文管理器** 大家好&#xff0c;我是晓星航。今天为大家带来的是 python文件 相关的讲解&#xff0…

51单片机学习之旅——定时器

打开软件 1与其它等于其它&#xff0c;0与其它等于0 1或其它等于1&#xff0c;0或其它等于其它 TMODTMOD&0xF0;//0xF01111 0000进行与操作&#xff0c;高四位保持&#xff0c;低四位清零&#xff0c;高四位定时器1&#xff0c;低四位定时器0 TMODTMOD|0x01;//0x010000 0…

51c大模型~合集69

我自己的原文哦~ https://blog.51cto.com/whaosoft/12221979 #7项基于SAM万物分割模型研究工作 1、CC-SAM: SAM with Cross-feature Attention and Context for Ultrasound Image Segmentation #ECCV2024 #SAM #图像分割 #医学图像 Segment Anything Model (SAM) 在自…

uniapp引入uview组件库(可以引用多个组件)

第一步安装 npm install uview-ui2.0.31 第二步更新uview npm update uview-ui 第三步在main.js中引入uview组件库 第四步在uni.scss中引入import "uview-ui/theme.scss"样式 第五步在文件中使用组件

ArcGIS Pro进行坡度与坡向分析

在地理信息系统中&#xff0c;坡度分析是一项至关重要的空间分析方法&#xff0c;旨在精确计算地表或地形的坡度&#xff0c;为地形特征识别、土地资源规划、环境保护、灾害预警等领域提供科学依据。本文将详细介绍如何利用ArcGIS Pro这一强大的地理信息系统软件&#xff0c;进…

在低功耗MCU上实现人工智能和机器学习

作者&#xff1a;Silicon Labs 人工智能&#xff08;AI&#xff09;和机器学习&#xff08;ML&#xff09;技术不仅正在快速发展&#xff0c;还逐渐被创新性地应用于低功耗的微控制器&#xff08;MCU&#xff09;中&#xff0c;从而实现边缘AI/ML解决方案。这些MCU是许多嵌入式…

革新之力:数字科技——重塑未来的超越想象之旅

在21世纪的科技浪潮中&#xff0c;数字科技如同一股不可阻挡的洪流&#xff0c;正以前所未有的速度和广度改变着我们的生活、工作乃至整个社会的结构。它不仅是技术的简单迭代&#xff0c;更是对人类社会认知边界的拓宽&#xff0c;对经济模式、社会治理、文化形态等多方面的深…

elabradio入门第八讲——帧同步技术

一、帧同步的相关知识 数字通信中&#xff0c; 为了使接收到的码元能够被理解&#xff0c;需要知道其如何分组。一般说来&#xff0c;接收端需要利用帧同步码去划分接收码元序列。将标志码组开始位置的帧同步码插入于一个码组的前面&#xff0c;如图所示。 这里的帧同步码是一…

Blender小技巧和注意事项

1.雕刻模式如果没反应,需要将模式转换成编辑模式 2. 鼠标移到大纲 点击 小键盘的. / 大键盘句号 , 在大纲视图快速找到选中物体 3.打包图像等数据进Blender文件中,可以防止丢失

vxe-table 如何实现跟 Excel 一样的数值或金额的负数自动显示红色字体

vxe-table 如何实现跟 Excel 一样的数值或金额的负数自动显示红色字体&#xff0c;当输入的值为负数时&#xff0c;会自动显示红色字体&#xff0c;对于数值或者金额输入时该功能就非常有用了。 查看官网&#xff1a;https://vxetable.cn gitbub&#xff1a;https://github.co…

二叉树的前序、中序、后序遍历(递归和非递归实现)

二叉树&#xff0c;顾名思义&#xff0c;就是一个节点最多有两个子节点的树&#xff0c;要访问二叉树内的所有节点&#xff0c;我们一般有三种方法&#xff1a;前序遍历&#xff0c;中序遍历和后续遍历。 前序遍历&#xff1a;访问顺序为“根-左-右”中序遍历&#xff1a;访问…

Spring Boot(七):Swagger 接口文档

1. Swagger 简介 1.1 Swagger 是什么&#xff1f; Swagger 是一款 RESTful 风格的接口文档在线自动生成 功能测试功能软件。Swagger 是一个规范和完整的框架&#xff0c;用于生成、描述、调用和可视化 RESTful 风格的 Web 服务。目标是使客户端和文件系统作为服务器以同样的…

STM32+Proteus+DS18B20数码管仿真实验

1. 实验准备 硬件方面&#xff1a; 了解 STM32 单片机的基本原理和使用方法&#xff0c;本实验可选用常见的 STM32F103 系列。熟悉 DS18B20 温度传感器的工作原理和通信协议&#xff08;单总线协议&#xff09;。数码管可选用共阴极或共阳极数码管&#xff0c;用于显示温度值。…

【进程与线程】Linux 线程、同步以及互斥

每个用户进程有自己的地址空间。 线程是操作系统与多线程编程的基础知识。 系统为每个用户进程创建一个 task_struct 来描述该进程&#xff1a;该结构体中包含了一个指针指向该进程的虚拟地址空间映射表&#xff1a; 实际上 task_struct 和地址空间映射表一起用来表示一个进程…

day16_推荐系统和总结

文章目录 day16_推荐系统和总结一、推荐实现1、基于流行度推荐&#xff08;掌握&#xff09;1.1 近期热门商品推荐1.2 个人热门商品推荐 2、基于隐语义模型的协同过滤推荐&#xff08;了解&#xff09;2.1 ALS算法介绍2.2 推荐代码 3、基于物品的协同过滤推荐&#xff08;了解&…

深度解析应用层协议-----HTTP与MQTT(涵盖Paho库)

HTTP协议概述 1.1 HTTP的基本概念 HTTP是一种应用层协议&#xff0c;使用TCP作为传输层协议&#xff0c;默认端口是80&#xff0c;基于请求和响应的方式&#xff0c;即客户端发起请求&#xff0c;服务器响应请求并返回数据&#xff08;HTML&#xff0c;JSON&#xff09;。在H…

redis的应用,缓存,分布式锁

1.应用 1.1可以用作缓存 作用&#xff1a;提交数据的查询效率&#xff0c;减少对数据库的访问频率 什么数据适合放入缓存 1.查询频率高&#xff0c;修改频率低 2.对安全系数比较低 如何实现 Service public class DeptServer {Autowiredprivate DeptMapper deptMapper;Auto…