【NoC片上网络 On-Chip Network】应用程序的网络流量 合成网络流量

  • 应用程序的网络流量 and 合成网络流量
    • 1. 应用程序的网络流量 APPLICATION TRAFFIC
    • 2. 合成网络流量 SYNTHETIC TRAFFIC
    • 3. 合成网络流量的具体介绍

应用程序的网络流量 and 合成网络流量

1. 应用程序的网络流量 APPLICATION TRAFFIC

在 MPSoC(多处理器片上系统) 中,应用程序的通信任务图(如图 3.8a 所示)决定了通过片上网络连接的各个 IP核 之间的流量。流量模型可以根据核心之间的平均流量来提取[156, 161]。这有助于为 MPSoC 运行的应用程序类别的流量驱动定制的网络拓扑和映射算法。任务图上的确定网络链路的吞吐量要求,而芯片上通信 IP 之间的路由器数量以及映射到相同链路的数据流流之间的争用则确定网络延迟。

在这里插入图片描述

通常在共享内存的多核系统中,应用程序的共享行为和所使用的一致性协议的类型(如监听协议(snoopy)、有限目录(limited-directory)与全位目录(full-bit directory))决定了网络流量。对于 N 个计算核心的芯片,协议的通信模式可以分为1对1、1对M和M对1,其中M指多个源或目的地(1 < M <= N)。一对一通信通常也称为单播通信(unicast),发生在内核之间交换的单播请求/响应中。一对多或多播通信(multicast)发生在广播和多播请求中。 M-to-1也叫做归约(reduction)通信发生在协议中的确认或令牌收集中以维持消息排序。全位目录跟踪每个共享者的状态,并使用单播和精确多播来保持一致性。监听协议和有限目录(即对共享者进行有限跟踪的目录协议)协议减少了目录存储空间,但需要更高的网络流量,这些流量以广播、多播和归约的消息形式进行通信。

来自应用程序的网络流量还取决于缓存大小和缓存层次结构,以及应用程序工作集的适合程度。L1 和 L2 的大小一定程度上决定了应用程序的未命中率(从DRAM中获取没命中的数据),进而决定了网络的注入率。与每核私有 L2 相比,分布式共享 L2 还具有更高的网络流量,因为每个 L1 未命中都必须遍历片上网络才能到达的主节点。内存相关的通讯流量还会穿过片上网络到达内存控制器,如果某些内核始终能够更快地访问内存控制器,则可能会导致服务质量问题(QoS)。

片上网络流量可以通过使用跟踪(trace)或运行全系统模拟来注入。

  1. 通信记录驱动的仿真(trace)。

研究人员经常使用在真实系统或全系统模拟器上运行的应用程序的网络注入痕迹(trace)。通信记录提供了一种相当可行的方法来探索所提出的片上网络设计的有效性,但显然,应该注意的是,它们的特性在很大程度上取决于模拟的多核平台:核心/IP 块的数量、内存层次结构、内存控制器的数量等都会显着影响网络跟踪(trace)。使用网络跟踪时缺乏反馈效果也会影响准确性。例如,高速的片上网络比收集通讯记录的系统仿真器网络具有更低的传输延迟,可能会导致在注入请求之前发送响应(可能会破坏通信记录之间的通信关系)。跟踪或推断数据包之间的依赖关系对于能够正确复现跟踪非常重要。

Netrace 是一组工具和跟踪,旨在通过在基于跟踪的模拟框架内添加依赖性跟踪来增强传统基于跟踪的片上网络模拟的性能和保真度。

  1. 全系统模拟。

全系统评估提供网络内最准确的网络流量动态变化,因为它们对整个系统(核心、缓存、一致性协议、网络和内存)进行详细建模,并启动运行应用程序的操作系统。然而,这些模拟占用了大量的模拟时间。共享内存和 MPI 应用程序的基准套件根据跨内核的应用程序线程映射、共享模式、一致性协议(如果共享内存)、高速缓存大小、内核模型(顺序或乱序)等信息,对片上网络施加不同程度的压力。类似的基准测试集包括 SPLASH-2、PARSEC 和 Rodinia。

2. 合成网络流量 SYNTHETIC TRAFFIC

合成流量模式(synthetic traffic pattern)有助于表征和调试片上网络。在大多数标准的合成网络流量模式中,所有源节点都以均匀随机的注入概率向网络中注入数据(无突发),而目的节点的坐标位置取决于具体的流量模式。表 7.2 列出了一些用于研究 mesh 网络的常见合成流量模式,以及它们的平均跳数和 XY 路由下的理论吞吐量。

在这里插入图片描述

理论吞吐量或容量是“mesh网络中某个(某些)链路每个周期发送 1 flit 的注入速率”(flit/node/cycle)。对于每种流量模式,假设 XY 路由,计算所有链路上的负载。确定负载最重的链路。理论吞吐量是该负载的倒数。这是假设拓扑所能做到的最好的路由、流量控制和微架构的前提下,所能达到的最好性能。合成流量模式对于表征片上网络的延迟和吞吐量非常有用,方法是绘制片上网络的延迟-吞吐量图,并将它们与基线和理想的网络进行比较。可以利用这些数据进行设计空间探索,看看是否可以用更少的缓冲区、VC、flit 大小、通道宽度等来满足所需的延迟和吞吐量。

除了传统的合成流量模式之外,还有模拟应用程序和缓存一致性流量的合成流量生成器。 SynFull 专注于合成再现缓存一致性流量中的流量依赖性以及通用 CMP 工作负载的应用程序不同阶段的流量波动。 APU-SynFull 扩展了这项工作,重点关注具有更复杂的一致性模式和更多突发流量的异构CPU-GPU架构。一般来说,可以采用合成网络流量的组合来检查和测试所提出的方法的局限性。真实网络trace可以大致验证方法的有效性。全系统仿真可以更准确地评估特定系统中的方法。可以用合成流量和真实网络trace与全系统仿真这两个技术的组合去分析所提出方法的利弊。

3. 合成网络流量的具体介绍

用流量矩阵表示流量分布,其中每个矩阵元素 λs,d 给出从节点 s 发送到节点 d 的流量的比例。表 3.1 列出了一些用于评估互连网络的常见静态流量模式。其中一些模式是基于特定应用程序中出现的通信模式。例如,矩阵转置或转角操作(matrix transpose or corner-turn operations)会引起转置模式,而快速傅里叶变换(FFT)或排序应用可能会导致洗牌排列,并且流体动力学模拟通常会表现出邻近模式(neighbor)。所有源节点都以均匀随机的注入概率向网络中注入数据(无突发)

在这里插入图片描述

随机流量(Random traffic)(其中每个源发送到每个目的地的可能性相同)是网络评估中最常用的流量模式。随机流量是非常良性的,因为通过使流量均匀分布,即使对于通常负载平衡很差的拓扑和路由算法,它也可以平衡负载。当仅使用随机流量进行评估时,一些非常糟糕的拓扑和路由算法看起来非常好。为了强调拓扑或路由算法,我们通常使用排列流量(permutation traffic),其中每个源 s 将其所有流量发送到单个目的地,d = π(s)。排列的流量矩阵其中每行和每列包含单个条目,所有其他条目为零,即只有一个目的地。由于它们将负载集中在各个源-目标对上,因此排列会强调拓扑和路由算法的负载平衡。

位排列(Bit permutation)是排列的子集,其中通过排列和选择性地补充源地址的位来计算目的地地址。例如,如果四位源地址为 {s3,s2,s1,s0},则位反转流量模式(Bit Reverse)的目的地为 {s0,s1,s2,s3};对于位补码(bit complement)流量模式,目的地为 {s0,s1,s2,s3}是 {-s3, -s2, -s1, -s0};对于shuffle洗牌,目的地是 {s2,s1,s0,s3};位旋转(Bit Rotation)旋转一位后的目的地地址为 {s0, s3, s2, s1}。

数字排列(Digit permutation)是排列的类似子集,其中目标地址的数字是根据源地址的数字计算的。这种排列仅适用于目标地址可以表示为 n-digit k-radix的网络,例如 k-ary n-cube torus网络和 k-ary n-flyd 蝶形网络。龙卷风(tornado)模式被设计为 torus 拓扑的对抗性(adversary)流量模式,而邻居(neighbor)流量则衡量拓扑利用局部性(locality)的能力

References:
[1] Dally, William James, and Brian Patrick Towles. Principles and practices of interconnection networks. Elsevier, 2004.
[2] Jerger, Natalie D. Enright, et al. On-chip networks. Vol. 12. No. 3. Morgan & Claypool, 2017.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/564291.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

书生·浦语大模型第二期实战营(6)作业

1。完成 Lagent Web Demo 使用&#xff0c;并在作业中上传截图。 文档可见 Lagent Web Demo 2、完成 AgentLego 直接使用部分&#xff0c;并在作业中上传截图。 文档可见 直接使用 AgentLego

前端crypto-js, 文件加密,判断相同文件、图片(MD5,SHA256)

文章目录 前情提要应用场景实战解析最后前情提要 大家好,今天我们来接触一个库crypto-js 没错,上面是有道翻译的截图,为了我们得到的信息更权威,这个库是用来加密的,但介绍是说,已经停止维护,但并不影响我们在前端项目中的使用,所以学学也没有坏处 应用场景 判断图片…

成电少年学fpga培训就业班怎么样

成电少年学是专注做FPGA培训的&#xff0c;以就业为导向&#xff0c;学习FPGA还是很有前途的&#xff0c;如果你是像电气、通信、自动化、物联网、集成电路这类专业&#xff0c;又不是名校高学历的&#xff0c;确实有必要可以考虑下校外培训机构。找工作多少会遇到一些问题&…

Linux下SPI设备驱动实验:使用内核提供的读写SPI设备中的数据的函数

一. 简介 前面文章的学习&#xff0c;已经实现了 读写SPI设备中数据的功能。文章如下&#xff1a; Linux下SPI设备驱动实验&#xff1a;验证读写SPI设备中数据的函数功能-CSDN博客 本文来使用内核提供的读写SPI设备中的数据的API函数&#xff0c;来实现读写SPI设备中数据。 …

【机器学习】各大模型原理简介

目录 ⛳️推荐 前言 一、神经网络&#xff08;联结主义&#xff09;类的模型 二、符号主义类的模型 三、决策树类的模型 四、概率类的模型 五、近邻类的模型 六、集成学习类的模型 ⛳️推荐 前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风…

系统启动修复和SYSTEM丢失损坏故障处理

系统启动修复和SYSTEM丢失损坏故障处理 一、问题描述 你的电脑/设备需要修复。无法加载应用程序或操作系统&#xff0c;原因是所需文件丢失或包含错误。 文件:\Windows\system32\winload.exe 错误代码: 0xc000000e 二、问题分析 1.查询winload.exe是win7或者win10以上系统…

地方政府专项债发债全过程-梳理

地方政府专项债发债全过程-梳理 一、什么是专项债&#xff1f; 地方政府专项债券&#xff08;以下简称“专项债券”&#xff09;&#xff0c;是指省、自治区、直辖市政府为有一定收益的公益性项目&#xff0c;发行的、约定一定期限内以公益性项目对应的&#xff0c;政府性基金…

ai写作软件哪个好,5款倍受好评的AI写作软件

ai写作软件哪个好&#xff0c;5款倍受好评的AI写作软件!在当今信息爆炸的时代&#xff0c;人们对于高效、智能的工具需求日益增加。AI写作软件因其独特的优势逐渐成为许多人的选择。但是在众多的AI写作软件中&#xff0c;究竟哪一款更胜一筹呢&#xff1f;下面将介绍5款倍受好评…

【每日一题】377. 组合总和 Ⅳ-2024.4.22

题目&#xff1a; 377. 组合总和 Ⅳ 给你一个由 不同 整数组成的数组 nums &#xff0c;和一个目标整数 target 。请你从 nums 中找出并返回总和为 target 的元素组合的个数。 题目数据保证答案符合 32 位整数范围。 示例 1&#xff1a; 输入&#xff1a;nums [1,2,3], t…

民航电子数据库:CAEMigrator迁移工具

目录 一、场景二、迁移步骤 一、场景 1、对接民航电子数据库 2、需要将mysql数据库迁移到民航电子数据库 3、使用CAEMigrator迁移工具 二、迁移步骤

世强硬创获昕感科技授权代理,SiC MOSFET实现超低导通电阻

近日&#xff0c;世强先进&#xff08;深圳&#xff09;科技股份有限公司&#xff08;下称“世强先进”&#xff09;获北京昕感科技有限责任公司&#xff08;下称“昕感科技”&#xff0c;英文名&#xff1a;NEXIC&#xff09;授权代理&#xff0c;为光伏、储能、电网、新能源汽…

NFT卡牌质押分红模式开发技术讲解分析

近年来&#xff0c;随着加密货币市场的快速发展&#xff0c;NFT&#xff08;Non-Fungible Token&#xff0c;非同质化代币&#xff09;作为一种独特的数字资产形式备受关注。其中&#xff0c;NFT卡牌质押分红模式是一种创新的应用场景&#xff0c;为用户提供了一种参与和投资的…

kubernetes中的副本控制器rc(replicationcontrollers)和rs(replicasets)

一、rc控制器replicationcontrollers rc控制器就是控制相同pod副本数量 使用rc控制器资源创建pod&#xff0c;设定创建pod资源的数量 1.1 案例 1.1.1、创建资源清单 [rootmaster rc-demo]# cat rc.yaml apiVersion: v1 kind: ReplicationController metadata: name: rc01 …

刘月红女士:医药行业三十年砥砺前行,助力斐尔玫瑰妇科诊所共创辉煌

在医药行业历经三十载风雨的刘月红女士&#xff0c;以其丰富的经验和深刻的行业洞察力&#xff0c;为医药行业的稳健发展作出了积极的贡献。从医药零售到医药批发&#xff0c;再到开设中医诊所&#xff0c;以及为各大医院提供药品供货&#xff0c;刘月红女士的足迹遍布医药领域…

Linux 存储:NAND 写入异常案例 (1)

文章目录 1. 前言2. 案例背景3. 案例问题4. 案例分析4.1 普通文件写入流程概要4.2 dd 写 NAND 时&#xff0c;会不会使用 page cache &#xff1f;4.3 dd 写 NAND 时&#xff0c;对比 U-Boot 读 NAND&#xff0c;是否采用了相同的坏块策略 &#xff1f;4.3.1 U-Boot 读 NAND 过…

纽扣电池卖家注意!美国纽扣电池UL4200A标准更新

2023年9月21日&#xff0c;美国消费品安全委员会CPSC(Consumer Product Safety Commission) 决定采用UL 4200A-2023&#xff08;包含纽扣电池或硬币电池的产品安全标准&#xff09;作为包含纽扣电池或硬币电池的消费品的强制性消费品安全规则&#xff0c;相关要求同时被编入到1…

MultiCD工具:创建一个多引导Linux USB驱动器

众所周知&#xff0c;拥有一个可安装多个可用操作系统的 CD 或 USB 驱动器在各种情况下都非常有用。无论是为了快速测试或调试某些内容&#xff0c;还是只是重新安装笔记本电脑或 PC 的操作系统&#xff0c;这都可以为你节省大量时间。 在本文中&#xff0c;将介绍如何使用名为…

linux,从零安装nginx,并且部署vue应用程序

前言&#xff1a;系统使用龙蜥&#xff08;8.5&#xff09;的最小化安装&#xff0c;服务器安装这里不在赘述。 nginx 的版本&#xff1a;1.22.0 软件已经放在系统/home/software/ 一、安装nginx 进入路径/home/software/ 1》执行命令&#xff1a;rpm -ivh nginx-1.22.0-1.el7…

GDC 笔记

1 Title Diffusion Improves Graph Learning&#xff08;Johannes Gasteiger, Stefan Weienberger, Stephan Gnnemann&#xff09;【NeurIPS 2019】 2 Conclusion This study removes the restriction of using only the direct neighbors by introducing a powerful, yet spa…

OpenLayers6实战,OpenLayers实现鼠标拖拽方式绘制环形(四分之一圆环),OpenLayers特殊图形绘制

专栏目录: OpenLayers6实战进阶专栏目录 前言 本章讲解如何使用OpenLayers在地图上实现鼠标拖拽方式绘制环形(四分之一圆环)的功能。 环形是一种由两个弧线和连接线组成的特殊图形,实现起来是有一定难度的。 二、依赖和使用 "ol": "^6.15.1"使用npm…