属于PCIe 7.0的那道光来了~

图片

随着数据洪流的持续涌动与计算密集型应用的爆发式增长,传统的电子互连技术在应对高带宽、低延迟、节能等多维度需求时日益显现其局限性。在这个背景下,光学互连技术以其独特的性能优势,逐渐成为业界瞩目的焦点,被视为未来数据中心互联技术的破局关键。

作为业界广泛采用的高速串行点对点互联标准,PCIe自诞生以来历经多次迭代升级,现已成为CPU、GPU、FPGA、SSD等计算设备间不可或缺的互连桥梁。PCIe 7.0标准更是将数据传输速率提升至令人惊叹的32 GB/s(每通道)。

图片

PCI-SIG在2022年6月的美国开发者大会(US DevCon)上宣布了PCI Express 7.0规范的持续进展。2023年6月发布版本0.3。最新进展,PCIe 7.0 ver0.5版本已经开放,同时宣布马不停蹄准备在2025年完成正式SPEC规范发布

图片

随着加速计算成为主流,PCIe连接在系统中的角色变得更加重要。直接的GPU-to-GPU通信对于跨多个图形处理器(GPU)或服务器、计算舱内的加速器扩展复杂计算任务至关重要。行业内部越来越认识到,在高性能计算领域中,对可扩展、开放式架构的需求日益增长。随着人工智能和数据密集型应用的不断发展,对这类技术的需求预计将会增加,使得PCIe 7.0成为下一代接口IP的关键组成部分

图片

在AI训练、大规模数据分析、实时渲染等应用中,数据传输速度和效率是决定系统性能的关键因素。PCIe 7.0提供的128 GT/s带宽相比前一代翻倍,这不仅意味着数据可以更快地在GPU之间流动,还支持更高效的资源分配和工作负载平衡。例如,在大规模机器学习模型训练场景中,多个GPU通过PCIe 7.0直接相连,能够大幅缩短训练时间和提高模型迭代速度,进而加快新算法和服务的开发与部署。

图片

此外,随着数据中心架构向更加分布式和灵活的方向发展,PCIe 7.0的高带宽和低延迟特性对于支持远程直接内存访问(RDMA)和高速数据传输尤为关键。这使得数据可以近乎实时地在不同的计算节点间移动,为构建高效、响应迅速的数据中心基础设施提供了可能。

PCIe 7.0不仅是数据传输速度的简单提升,它还是推动高性能计算架构向更加灵活、可扩展方向发展的关键技术。随着技术的不断成熟和应用的深化,PCIe 7.0有望成为加速计算新时代的基石,支撑起AI、大数据、云计算等多个领域的发展和创新

图片

尽管PCIe协议优化了延迟表现,但在大规模数据中心内部,距离延长与互连层级增加会导致延迟累积。随着数据速率提升,互连功耗问题日益突出,对整体能效与散热设计构成挑战。

在这样的环境下,数据中心内部以及不同数据中心之间的高速数据传输需求急剧增长。AI应用如深度学习、机器学习等需要处理海量数据,且对实时性和带宽有着极高的要求。传统的铜线介质的PCIe总线,在传输距离、带宽扩展以及信号完整性方面存在物理限制,难以满足大规模数据中心之间长距离、高带宽的数据传输需求

图片

因此,业界开始探索将PCIe协议应用于光学链路之上,即所谓的PCIe over Optics技术。这一技术通过将PCIe信号转换为光信号进行传输,利用光纤的大容量、低损耗和长距离传输特性,突破了传统铜线接口的距离与速度瓶颈。

PCI-SIG也已成立PCIe Optical Workgroup,致力于制定PCIe over Optical的标准,实现与现有PCIe生态的无缝对接。比如,Synopsys与OpenLight等光子技术厂商合作,开发支持光学解决方案。

图片

PCIe over Optics解决方案通常包括以下几个关键环节:

  1. 光电转换:首先,使用先进的光电转换器(Electro-optical transceivers),将服务器主板上的电信号转换为光信号,以确保数据能够在光纤上传输。

  2. 高性能控制器和PHY:设计专用的高性能PCIe控制器和物理层芯片(PHY),能够支持最新的PCIe标准,并优化其与光学接口的对接,保证数据在经过光传输后的完整性和准确性。

  3. 光学引擎:采用高效的光学引擎,如Nubis XT1600线性光学引擎,它能够提供多通道、全双工的数据传输能力,并保持较低的延迟和功耗。

  4. 长距离无损传输:由于光纤不受电磁干扰影响,可以实现千米级别的无损传输,大大拓展了服务器集群间的连接范围,使得数据中心内的设备可以更加灵活地分布在更大空间内,同时不影响数据通信性能。

  5. 模块化和标准化:尽管某些解决方案可能为定制化产品,但总体趋势是向模块化和标准化方向发展,确保不同厂商的产品可以相互兼容,便于数据中心运营商灵活选择并整合到现有或未来的数据中心架构中。

在上周举办的PCI-SIG DevCon 2024上,Cadence展示了一款专为下一代PCIe 7.0标准设计的光学连接解决方案,是行业内首个基于光学技术的PCIe 7.0演示,这一成就标志着数据传输速度和互连技术的重大飞跃。

图片

Cadence 为测试芯片构建了一个完整的子系统,这个系统包含八通道的PHY(物理层接口)以及一个完整的8通道控制器。在测试芯片中集成控制器的做法,对特性表征和压力测试的效率与精细度带来了显著提升。Cadence PCIe 7.0 PHY IP示意图:

图片

Cadence 能够模拟并测试整个协议栈作为一个单元,这涵盖了客户在实际应用中广泛使用的多种配置。这样做的一大优势在于,它能够更全面地模拟真实环境下的工作条件,发现并解决设计初期可能存在的问题,从而大幅度降低客户在其系统级芯片(SoC)设计中可能面临的各种风险。

图片

Cadence公司成功演示了其128GT/s PCIe 7.0 IP在实际应用条件下的强大传输(TX)和接收(RX)能力,这些条件包括低延迟、无需重定时的线性光学连接。

图片

Cadence团队不仅展示了这一先进接口的速度潜力,而且在连续两天的不间断演示期间,维持了一个非常稳定的预前向纠错(pre-FEC)误码率(BER)约为3E-8的高水平表现。这一数值远低于PCIe规范要求的1E-6,意味着即使在极端条件下,该系统也能提供足够的冗余来确保数据的准确无误传输,为后续的RS纠错编码留下了充足的空间。这意味着即便在数据传输过程中出现极小的错误,系统也有能力自我修正,保证数据的完整性。

图片

从Cadence展示的接收端PAM4眼图直方图中可以看出,信号的线性度和裕量表现优秀,这反映了其在处理高速数据传输时的高稳定性和可靠性。眼图的开阔和清晰表明了信号在经过长距离传输后仍能保持高质量,这对于确保在复杂系统环境中的高效数据交换至关重要。

这项演示不仅是对PCIe 7.0技术潜力的有力证明,也预示着光学互连技术在高速数据传输领域的新突破。通过克服传统铜缆在高速率下的信号衰减和干扰问题,光学连接为PCIe 7.0的广泛应用打开了新的大门,尤其是在对数据传输速度和延迟有极高要求的高性能计算(HPC)、人工智能(AI)、数据中心等领域。

随着PCIe 7.0标准的推进和商用化,此类光学连接解决方案有望成为下一代计算平台和数据中心架构的关键组成部分,推动整个行业向更高效、更快速的数据处理时代迈进。

扩展阅读:

  • PCIe 6.0生态业内进展分析总结

  • 浅析PCIe 6.0功能更新与实现的挑战

  • PCIe P2P DMA全景解读

参考文档:

  • https://pcisig.com/events/pci-sig-developers-conference-2024

  • https://community.cadence.com/cadence_blogs_8/b/ip/posts/cadence-demonstrates-complete-pcie-7-0-solution-at-pci-sig-devcon-24

  • https://www.servethehome.com/amd-infinity-fabric-afl-scale-up-competitor-to-nvidia-nvlink-coming-to-broadcom-switches-in-pcie-gen7/


如果您看完有所受益,欢迎点击文章底部左下角“关注”并点击“分享”、“在看”,非常感谢!

精彩推荐:

  • 深度剖析:AI存储架构的挑战与解决方案

  • 浅析英伟达GPU NCCL P2P与共享内存

  • 3D NAND原厂:哪家芯片存储效率更高?

  • 大厂阿里、字节、腾讯都在关注这个事情!

  • 磁带存储:“不老的传说”依然在继续

  • 浅析3D NAND多层架构的可靠性问题

  • SSD模拟器MQSim简介与资料分享

  • 孙凝晖院士万字长文|人工智能与智能计算的发展

  • 探究NVMe SSD HMB应用场景与影响

  • 深度剖析:大容量QLC SSD为何遭疯抢?

  • SSD突然掉电,是谁保护了用户数据?

  • 漫谈HAMR硬盘的可靠性

  • 万物皆可计算|下一个风口:近内存计算

  • SSD数据错误如何修复?

  • CXL与PCIe世界的尽头|你相信光吗?

  • 全景剖析SSD SLC Cache缓存设计原理

  • 存储革新:下一代低功耗PCM相变存储器

  • 3D DRAM虽困难重重,最快明年到来

  • 字节跳动入局存储内存SCM

  • PCIe 7.0|不要太卷,劝你先躺平

  • SSD LDPC软错误探测方案解读

  • 关于SSD LDPC纠错能力的基础探究

  • 存储系统如何规避数据静默错误?

  • PCIe P2P DMA全景解读

  • 深度解读NVMe计算存储协议

  • 对于超低延迟SSD,IO调度器已经过时了吗?

  • 浅析CXL P2P DMA加速数据传输的原理

  • 浅析LDPC软解码对SSD延迟的影响

  • 为什么QLC NAND才是ZNS SSD最大的赢家?

  • SSD在AI发展中的关键作用:从高速缓存到数据湖

  • 浅析不同NAND架构的差异与影响

  • SSD基础架构与NAND IO并发问题探讨

  • 字节跳动ZNS SSD应用案例解析

  • CXL崛起:2024启航,2025年开启新时代

  • NVMe SSD:ZNS与FDP对决,你选谁?

  • 浅析PCI配置空间

  • 浅析PCIe系统性能

  • 存储随笔《NVMe专题》大合集及PDF版正式发布!

如果您也想针对存储行业分享自己的想法和经验,诚挚欢迎您的大作。
投稿邮箱:Memory_logger@163.com (投稿就有惊喜哦~)

《存储随笔》自媒体矩阵

图片

如您有任何的建议与指正,敬请在文章底部留言,感谢您不吝指教!如有相关合作意向,请后台私信,小编会尽快给您取得联系,谢谢!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/721363.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Android开发系列(三)Jetpack Compose 之TextField

TextField 是一个用于接收用户输入的UI组件。它是Jetpack Compose中的一部分,可以方便地实现用户文本输入的功能。 TextField 允许用户输入一个或多个文本行,可以用于接收用户的文本输入、搜索等操作。它提供了一些常用的功能,如输入验证、键…

[Qt] Qt Creator 编译输出乱码,问题页中的报错、警告内容,编译输出乱码

确保文件编码为"UTF-8","如果编码是UTF-8则添加",如下图: 设置IDE环境语言跟随系统语言,Text codec for tools: "System" 瑞斯拜

从“小IPD”到“大IPD”

IPD体系实施或变革是一个长期的系统工程,业界经常有从“小IPD”到“大IPD”的说法。 像华为当年就是从“产品开发流程”开始推行,算是很小范围的“小IPD”了,后面逐步扩大为“大IPD”,如上图所示。其中前端的市场管理(…

序列化与反序列化漏洞实例

实验环境&#xff1a; 本次的序列化与反序列化漏洞为2021年强网杯上的一道比赛题目&#xff0c;我使用phpstudy集成环境将其测试环境搭建在了本地&#xff0c;如下。涉及的几个页面php为&#xff1a; index.php function.php myclass.php index.php : <?php // inde…

在Linux系统中安装凸语言

凸语言在2023国产编程语言蓝皮书中的介绍如下&#xff1a; 凸语言gitee页面&#xff1a;凸语言: tu-lang 是一种动态类型编译型的通用编程语言, 已实现自举 (gitee.com) 使用git克隆源码&#xff1a; git clone https://github.com/tu-lang/tu.git 安装凸语言环境&#xff1a…

4M-21:霸气侧漏高效的20+多模态AI模型

大模型技术论文不断&#xff0c;每个月总会新增上千篇。本专栏精选论文重点解读&#xff0c;主题还是围绕着行业实践和工程量产。若在某个环节出现卡点&#xff0c;可以回到大模型必备腔调或者LLM背后的基础模型重新阅读。而最新科技&#xff08;Mamba,xLSTM,KAN&#xff09;则…

云电脑有多好用?适合哪些人使用?

云电脑作为一种新型的计算模式&#xff0c;其应用场景广泛且多样&#xff0c;适合各类人群使用。云电脑适合什么人群使用&#xff1f;云电脑有哪些应用场景&#xff1f;有什么好的云电脑推荐&#xff1f;以下本文将详细探讨云电脑的主要应用场景及其适用人群的相关内容&#xf…

英伟达发布开源模型Nemotron-4 340B

&#x1f680; 英伟达发布开源模型Nemotron-4 340B 摘要&#xff1a;英伟达最新发布的开源模型Nemotron-4 340B&#xff0c;可能彻底改变大语言模型&#xff08;LLM&#xff09;训练方式。该模型支持多种自然语言和编程语言&#xff0c;使用9万亿个token训练&#xff0c;高达9…

自制调色小工具给图片加滤镜,修改图片红、绿、蓝通道及亮度,修改图片颜色

上篇&#xff1a; 上篇我们给地图添加了锐化、模糊等滤镜&#xff0c;这篇来写一个小工具给图片调色。 调色比锐化等滤镜要简单许多&#xff0c;直接拿到像素值修改即可。不需要用到卷积核。。。(*^▽^*) 核心原理就是图像结构&#xff0c;使用context.getImageData获取图像像…

从零开始:精通基于大型语言模型(LLM)的Agent应用开发

一、引言 随着人工智能技术的飞速发展&#xff0c;大型语言模型&#xff08;Large Language Model&#xff0c;简称LLM&#xff09;已经成为自然语言处理&#xff08;NLP&#xff09;领域的核心技术之一。这些模型&#xff0c;如GPT、BERT等&#xff0c;通过大量的文本数据训练…

一文读懂OpenGVLab带来的最新视觉预训练框架

大模型技术论文不断&#xff0c;每个月总会新增上千篇。本专栏精选论文重点解读&#xff0c;主题还是围绕着行业实践和工程量产。若在某个环节出现卡点&#xff0c;可以回到大模型必备腔调或者LLM背后的基础模型重新阅读。而最新科技&#xff08;Mamba,xLSTM,KAN&#xff09;则…

常用的sql语句

一条sql语句更新两个表的内容的sql语句 UPDATE urlName,siteName SET urlurl,namename WHERE siteName.zidurlName.zid AND IDIN ; select * from user_tab_comments;//查询表的注释 select * from user_col_comments;//查询列的注释 select * from all_tables;//查询此用户…

SpringBoot快速入门-上

Apache Tomcat Apache Tomcat是一个开源的Servlet 或 web容器&#xff0c;它实现了Java Servlet、JavaServer Pages (JSP)、Java Unified Expression Language (JUEL) 和 Java WebSocket 规范。 使用 官网下载 安装:绿色版 , 直接解压 卸载:直接删除目录 改编码: # conf/l…

强得离谱,AI音乐的 Stable Diffusion: MusicGen

节前&#xff0c;我们星球组织了一场算法岗技术&面试讨论会&#xff0c;邀请了一些互联网大厂朋友、参加社招和校招面试的同学。 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 合集&#x…

烂笔头笔记:为JDK安装Charles证书,让你的请求能够像在浏览器中那样被抓包

为什么要为JDK安装Charles证书 众所周知&#xff0c;https就是为了防止中间过程被拦截从而导致数据泄密的。若强行加入Charles代理&#xff0c;数据被解密后再被其重新加密&#xff0c;数据已经被“破坏”&#xff0c;客户端从而拒绝建立连接或解析内容。 #mermaid-svg-ksLo5W…

安装,管理程序

文章目录 Linuxd应用程序基础应用程序与系统命令的关系 典型应用程序目录常见的软件包装类型 rpm软件包管理工具RPM软件包rpm命令格式查询rpm软件包信息查询已安装的查询未安装的 安装或升级rpm软件卸载指定rpm软件辅助选项 维护RPM数据库解决软件包依赖关系方法 源代码编译安装…

[面试题]缓存

[面试题]Java【基础】[面试题]Java【虚拟机】[面试题]Java【并发】[面试题]Java【集合】[面试题]MySQL[面试题]Maven[面试题]Spring Boot[面试题]Spring Cloud[面试题]Spring MVC[面试题]Spring[面试题]MyBatis[面试题]Nginx[面试题]缓存[面试题]Redis 什么是缓存&#xff1f;…

MySQL数据库入门

1、MySQL概述 MySQL官方网站 https://www.mysql.com/downloads/ MySQL被Oracle公司收购了&#xff0c;作者又重新编写了一个开源的数据库管理系统&#xff0c;Mariadb 2、MySQL产品&版本 2、数据库在网站架构中的角色 LAMP LNMP网站架构 3、安装MySQL-基于yum 查…

【网络编程】套接字的多种可选项

可以看出&#xff0c;套接字可选项是分层的。IPPROTOIP层可选项是IP协议相关事项IPPROTO TCP层可选项是TCP协议相关的事项&#xff0c;SOLSOCKET层是套接字相关的通用可选项 getsockopt&&setsockopt #include <sys/socket.h> int getsockopt(int sock, int lev…

IO流..

1.IO流-->用于读写文件中的数据 2.IO流的分类 import java.io.FileOutputStream; import java.io.IOException;public class Stream {public static void main(String[] args) throws IOException{FileOutputStream fosnew FileOutputStream("abc\\a.txt");fos.w…