【Interconnection Networks 互连网络】Torus 网络拓扑

  • 1. Torus 网络拓扑
  • 2. Torus 网络拓扑结构
  • References

1. Torus 网络拓扑

Torus 和 Mesh 网络拓扑,又可以称为 k-ary n-cubes,在规则的 n 维网格中包裹着 N = k^n 个节点,每个维度都有 k 个节点,并且最近邻居之间有通道。k-ary n-cubes包含一系列网络,从 rings (n = 1) 到 binary n-cubes (k = 2),也称为超立方体(hypercubes)。

这些网络的优势在于规则的物理排列与封装限制很好地匹配。在小尺寸下,tori具有统一的短线,允许高速运行而无需中继器。tori中逻辑上最小的路径几乎总是物理上最小的。这种物理的一致允许环面和网状网络利用通信节点之间的物理局部性。对于本地通信模式,例如每个节点在第一维中向其邻居发送消息,与随机流量相比,延迟要低得多,吞吐量要高得多,而蝴蝶网络无法利用这种局部性。

Tori 具有良好的路径多样性,即使在排列流量上也能具有良好的负载平衡。此外,由于torus或mesh网络中的所有通道都是双向的,因此它们可以利用双向信号,从而更有效地利用引脚和电线。

Tori网络的一个缺点是它们比对数网络具有更大的跳数。这使得它们的延迟略高于最小界限,并增加了网络的引脚成本。但请注意为了路径多样性,跳数的增加是必要的。设计者可以通过选择网络的维度 n 来确定环面网络的属性。网络的吞吐量随着维度单调增加,直到网络二分受限。对于低维度,延迟由高跳数 H 主导,而对于高维度,序列化延迟 Ts 占主导地位。最小延迟通常在相对较低的维度上实现,通常在 2 到 4 之间。为了最小化延迟和线路长度,我们通常选择 n 作为限制网络平分的最小维度。

2. Torus 网络拓扑结构

n-dimensional, radix-k torus或 k-ary n-cube,由 N = kn 个节点组成,每个维度上有 k 个节点。torus 作为一个直接网络,这N个节点中的每一个都同时充当网络的输入端、输出端和交换节点。每个节点都分配有一个 n 位 radix-k 的地址 {an−1,…,a0}作为坐标,并通过一对通道(每个方向一个)连接到地址相差 ±1 (mod k) 的节点,总共需要2nN 个 channels。Tori 是规则的(所有节点具有相同的度数)并且也是边对称的,这有助于改善通道之间的负载平衡。

一般来说,tori可以通过迭代添加维度来构造任意 k 元 n 立方体,如图 5.1 所示。 k-ary 1-cube(图 5.1[a]) 只是一个 k 节点环。将 k 个 1-cube 连接成一个循环会增加第二个维度,形成 k-ary 2-cube (图 5.1[b])。该过程持续一个维度,将 k 个 k-ary (n − 1)-cube 组合成一个 k-ary n-cube(图 5.1[c])。
在这里插入图片描述

Mesh 网络拓扑是 Torus 网络拓扑在每个方向上省略从节点 ak-1 到节点 a0 的连接。例如,图 5.2 将 4-ary 2-cube (torus)与 4-ary 2-mesh 进行了比较。Mesh 具有相同的节点的度,但对分带宽通道的数量是具有相同基数和维度的 torus 拓扑的一半。尽管 mesh 具有非常自然的二维布局,可以保持较短的通道长度,但它放弃了 torus 的边缘对称性。这可能会导致许多流量模式的负载不平衡,因为 mesh 拓扑的中央通道的需求可能明显高于边缘通道

从图中很容易看出,如果每个方向 channel 的信道带宽为 (b), a k-ary n-cube 的二等分带宽是 (B = 4k^{n-1} b )
在这里插入图片描述

torus 可以是单向的,在每一维中仅具有一个方向(从 ai 到 ai+1)的通道,也可以是双向的,在连接的节点之间具有两个方向的通道。mesh 也可以构成成单向或双向;然而,单向的 mesh 由于没有较长的边缘通道,因此必须在不同行之间交替改变方向,以保持网络完全连接。即使成本增加,双向网络通常也是首选,因为它们具有较低的跳数 H 和更大的路径多样性。一般来说,我们认为环面或网格是双向的

Torus 网络的每个维度可以具有不同的基数。例如,图 5.3 显示了一个 2,3,4-ary 3-mesh,其 y 维度的基数为 2,z 维度的基数为 3,x 维度的基数为 4。混合基数环面和网格通常是出于封装和模块化的实际原因而构建的。然而,混合基数 tori 不再是边对称的,并且与单基数 mesh 相比,混合基数网格更加不对称。这些不对称引入了负载的不平衡,并且对于许多流量模式(包括均匀流量),较长维度上的信道负载大于较短维度上的负载。对于均匀流量(例如 γx),图 5.3 中 x 维度上的负载将是 γz 的两倍(可以简单地理解,在 X 维度,每个节点需要和其余三个节点通信,其中设置一对一节点的通信量为r,总共通信量就是 X 维度上的总的通信量是 12r,而 Z 维度上任意link的通信量都是 6r,故在均匀随机流量模式下,x 维度上的负载将是 γz 的两倍)。

在这里插入图片描述

References

[1] Dally, William James, and Brian Patrick Towles. Principles and practices of interconnection networks. Elsevier, 2004.
[2] Jerger, Natalie D. Enright, et al. On-chip networks. Vol. 12. No. 3. Morgan & Claypool, 2017.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/565133.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

数据可视化(八):Pandas时间序列——动态绘图,重采样,自相关图,偏相关图等高级操作

Tips:"分享是快乐的源泉💧,在我的博客里,不仅有知识的海洋🌊,还有满满的正能量加持💪,快来和我一起分享这份快乐吧😊! 喜欢我的博客的话,记得…

关于杰理AC695蓝牙模式下按键处理函数处理

一、杰理蓝牙模式下又分为SYS_KEY_EVENT和SYS_BT_EVENT。SYS_KEY_EVEN主要是对按键的控制事件,SYS_BT_EVENT是蓝牙模式协议栈状态事件、hci事件、对箱事件。 二、按键通过key_event *key &event->u.key; u定义了一个union事件的联合体,通过按键k…

【C++ STL序列容器】array 数组

文章目录 【 1. 基本原理 】【 2. array 的创建 】2.1 不赋初值2.2 赋默认值2.3 赋指定值 【 3. array 的成员函数 】实例 【 1. 基本原理 】 array 是在 C 普通数组的基础上添加了一些成员函数和全局函数。在使用上,它 比普通数组更 安全,且效率并没…

Web3钱包开发获取测试币-Base Sepolia(二)

Web3钱包开发获取测试币-Base Sepolia(二) ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/b0c0ac86b04a496087471388532bc54a.png) 基于上篇 Web3钱包开发获取测试币-Polygon Mumbai(一) :https://suwu150.blog.csdn.net/article/details/137949473 我…

呼市经开区建设服务项目水、电能耗监测 数采案例

一、项目背景及需求 项目地点位于内蒙古呼和浩特市,呼市数字经开区建设服务项目。属于企业用能数据采集、能耗监测板块子项目。 针对水、电能耗数据采集,结合现场客观因素制约,数据采集方面存在较大难度。大多数国网电表485接口由于封签限制…

WordPress 告别 MySQL:Docker SQLite WordPress

本篇文章聊聊,如何将这个持续诞生和维护了 21 年的开源软件“脱离数据库”运行,让它能够更加轻量、适合低成本离线运行。 写在前面 2003 年,Michel Valdrighi 基于 b2/cafelog 创建了开源软件 WordPress,并在 GPL 协议下发布。 …

【ARM Trace32(劳特巴赫) 使用介绍 12.1 -- Trace32 读写 64位地址】

请阅读【Trace32 ARM 专栏导读】 文章目录 Trace32 读写 64位地址读 64 位地址写64位地址Trace32 读写 64位地址 在使用TRACE32进行调试时,有时需要读取或操作64位的地址,特别是在处理64位的处理器或操作系统时。以下是如何在TRACE32中读取64位地址的一般方法。 读 64 位地…

Hadoop大数据处理技术-配置连接篇

​2024/4/17 Hadoop学习前的准备 3)连接虚拟机 上一节配置完成了基础的虚拟机配置及网络配置 下面我们开始建立连接 我们为什么要与虚拟机建立链接呢? 连接虚拟机就好像跟亲友联系一样 总得找个便捷又好用的工具才行 Secure CRT就像是一把能打开通向…

高斯过程回归【详细数学推导】

机器学习笔记 第一章 机器学习简介 第二章 感知机 第三章 支持向量机 第四章 朴素贝叶斯分类器 第五章 Logistic回归 第六章 线性回归和岭回归 第七章 多层感知机与反向传播【Python实例】 第八章 主成分分析【PCA降维】 第九章 隐马尔可夫模型 第十章 奇异值分解 第十一章 熵…

AI-数学-高中-39空间向量-2空间向量法(法向量)

原作者视频:【空间向量】【一数辞典】2空间向量法(重要)_哔哩哔哩_bilibili 法向量(高中阶段所有与面的关系,都可以通过法向量去证明和解答): 是空间解析几何的一个概念,垂直于平面…

JAVA学习笔记28(常用类)

1.常用类 1.1 包装类 1.包装类的分类 ​ 1.针对八中基本数据类型相应的引用类型–包装类 ​ 2.有了类的特点,就可以调用类中的方法 2.包装类和基本数据类型的转换 ​ *装箱:基本类型 --> 包装类型 //手动装箱 int n1 100; Integer integer ne…

上市公司-企业数据要素利用水平数据集及参考文献(2010-2022年)

01、数据介绍 企业数据要素利用水平是指企业在其生产经营活动中,对数据的收集、处理、分析和应用的能力及效果。这种利用水平的高低直接反映了企业在数字化时代中的竞争力和创新能力。 本数据参考《中央财经大学学报》史青春(2023)老师的研…

Excel文件解析--超大Excel文件读写

使用POI写入 当我们想在Excel文件中写入100w条数据时,我们用普通的XSSFWorkbook对象写入时会发现,只有在将100w条数据全部加载入内存后才会用write()方法统一写入,这样效率很低,所以我们引入了SXSSFWorkbook进行超大Excel文件的读…

javaWeb项目-网吧网咖管理系统功能介绍

项目关键技术 开发工具:IDEA 、Eclipse 编程语言: Java 数据库: MySQL5.7 框架:ssm、Springboot 前端:Vue、ElementUI 关键技术:springboot、SSM、vue、MYSQL、MAVEN 数据库工具:Navicat、SQLyog 1、JAVA简介 JavaSc…

本地环境通过ssh通道连接服务器数据库,实现本地客户端和代码可以访问数据库

使用方法: ssh -p 搭建隧道的端口 -fNL 本地端口:远程ip:远程端口号 搭建隧道的账号搭建隧道的ip 可以增加参数-v,输出更多的信息 ssh -p 搭建隧道的端口 -fNL 本地端口:远程ip:远程端口号 -v 搭建隧道的账号搭建隧道的ip 有时候,测试环境的数据库不允许…

深度卷积神经网络的整体运行流程(以alexnet为例)

0.基础概念(复习一下) 1.小批量随机梯度下降 目的: 希望找到最佳的参数,使损失函数最小。 使损失函数对w求导(b就是x等于1的w),一个小批次的/eta(学习率)*小批次的平均…

hexo配置教程、主题使用及涉及的技术学习

一、背景 最近,一直想做一个属于自己的网站.可以从零开始搭建一个网站,顺便可以把日常中学到的技术用于实战,还可以顺便记录自己的所思所感,记录成长的过程. 方案 一开始的方案是从零开始,模仿常见个人博客的设计,基于vueSpringbootMySQL的去实现网站. 新建项目之后,发现vu…

【网络原理】UDP协议的报文结构 及 校验和字段的错误检测机制(CRC算法、MD5算法)

目录 UDP协议 UDP协议的报文结构及注意事项 UDP报文结构中的校验和字段 1. 校验和主要校验的内容 2. UDP校验和的实现方式 3. CRC(循环冗余校验)算法 4. MD5(Message Digest Algorithm 5) UDP协议 上一篇文章提过&#xf…

Linux cmake 初窥【1】

1.开发背景 linux 下编译程序需要用到对应的 Makefile,用于编译应用程序,但是 Makefile 的语法过于繁杂,甚至有些反人类,所以这里引用了cmake,cmake 其中一个主要功能就是用于生成 Makefile,cmake 的语法更…

吴恩达深度学习 (week5,6)

文章目录 一、训练开发测试集二、机器学习基础三、 正则化初步介绍四、Dropout 正则化五、其他正则化方法六、归一化输入介绍七、梯度消失与梯度爆炸八、神经网络的权重初始化九、梯度数值逼近和检验十、上述学习总结第一题 划分训练/开发/测试集第二题 开发和测试集分布第三题…