一文读懂AI时代GPU的内存新宠-HBM

ba2c196b746acc3646b58a1605dbd6bc.jpeg 

一文读懂GPU最强辅助:HBM

   

HBM,即高带宽内存,是一项领先的3D堆叠DRAM技术,专为高性能计算和图形处理单元(GPU)设计,满足其对内存带宽和容量的极致需求。该技术由AMD与海力士携手研发,并于2013年问世,为行业带来革命性突破。

42bbb5d059699ebe54ad991647ed60d6.jpeg

随着计算需求的不断增长,传统的内存技术已经难以满足高性能计算(HPC)和图形处理单元(GPU)对内存带宽和容量的日益增长的需求。在这样的背景下,高带宽内存(HBM)技术应运而生,为解决这一问题提供了创新性的解决方案。
f6d8d28c624ee8fc3b0c00f908278f71.jpegHBM是一种3D堆叠DRAM技术,它通过将多个DRAM芯片层叠在一起,并使用高密度的硅通孔(TSV)和微凸点(microbumps)技术,实现与处理器或GPU的垂直互连。这种设计大幅提高了内存的带宽和容量,同时减小了内存模块的物理尺寸。与传统的GDDR5内存相比,HBM由于其紧凑的设计和高效的数据传输,通常具有更低的功耗。

99d5c73564ea4d632d76da766d898757.jpeg

HBM产品系列已进化至第五代HBM3E,作为HBM3的扩展版,持续引领技术前沿。GPU现普遍支持2至8颗堆叠,最大堆叠层数达12层,展现了卓越的集成与性能优势。

4d25013fd9e0d728f1b13e9134121c4b.jpeg

美光科技于2月26日宣布批量生产HBM3E高带宽内存,其24GB 8H产品将供货给英伟达,并用于H200 Tensor Core GPU。这款内存拥有24GB大容量,引脚速度突破9.2Gb/s,提供高达1.2TB/s的内存带宽,为AI加速器、超级计算机等数据应用带来前所未有的闪电速度。美光HBM3E,引领内存技术新篇章。

0e11f03d5771b4a37964143b74daefbe.jpeg

英伟达H200 GPU搭载6颗美光HBM3E 24GB高速显存,理论上内存容量应为144GB,带宽达7.2TB/s。然而,量产考量下,英伟达官网显示其显存为141GB,带宽为4.8TB/s。这一调整旨在通过保留冗余空间,提升产品良品率,确保用户获得稳定高效的AI训练体验。

390044eb91a8d586cf5a5f3e92638b75.jpeg

HBM 不断迭代,迭代方向为增加容量和带宽,目前最高层数为12层。海力士 2014 年推出全世界第一颗 HBM,2018 年推出 HBM2,后续每隔两年推出新一代HBM,目前最新量产的是HBM3e,原厂加速研发,HBM4 可能采用16层堆 叠。从 I/O 数量看(总线位宽),HBM1到HBM3e均保持在1024bit, 而数据的传输速率从HBM1的1Gb/s 提升到 HBM3e的9.2Gb/s,最终实现带宽从HBM1的128GB/s 提升至 HBM3e的1.2TB/s。

HBM4的标准目前未确定,目前普遍预期HBM4最高16层堆叠,2048bit总线位宽。

d33289ad799d61fafb67ed05542936c1.jpeg

HBM市场主要由三大存储巨头所主导:

SK海力士,HBM技术的领军者,从早期开发到技术迭代如HBM2、HBM2E至HBM3,均保持领先地位。其卓越的创新和量产能力,使其成为伟达AI芯片HBM的首选供应商,市场份额遥遥领先,彰显技术实力与行业地位。

6f90dd0006783fc59649aff6d5df9e3d.jpeg

三星电子:三星电子是全球领先的半导体公司之一,在HBM技术方面也具有强大的研发和生产能力。三星电子不仅在HBM的研发上投入巨大,还积极扩大产能以满足市场需求。三星电子在HBM技术上的进展,包括开发更高密度和更大容量的产品,对提升其在高性能计算和AI领域的竞争力起到了关键作用。三星着重满足其他云端服务业者的订单,在客户加单下,预计在 HBM3 与海力士的市占率差距会大幅缩小,

2023~2024 年三星和海力士市占率预估相当,合计拥 HBM 市场约 95%的市占率

美光科技虽在HBM市场起步晚于SK海力士和三星,但凭借直接从HBM3E切入并快速增强技术实力,正逐步挑战市场格局。尽管市场份额尚低,但英伟达在H200中选用美光产品,展现了对其的高度认可,美光正在迅速追赶中。


-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/688629.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

聊聊二叉堆、红黑树、时间轮在定时任务中的应用

定时任务作为常用的一种调度方式,在各大系统得到了广泛的应用。 笔者也曾写过两篇关于定时任务框架介绍的文章: 《介绍一下,spring cloud下的另一种定时任务解决方案》《四叉堆在GO中的应用-定时任务timer》 之前都是以如何使用为主,这次从…

【UML用户指南】-10-对高级结构建模-高级类

目录 1、类目 2、高级类 3、可见性 4、实例范围和静态范围 5、抽象元素、叶子元素和多态性元素 6、多重性 7、属性 8、操作 9、模板类 10、标准元素 1、类目 类目 (classifier)是描述结构特征和行为特征的机制。类目包括类、关联、接口、数据类…

【YOLOv10改进[CONV]】使用DualConv二次创新C2f模块实现轻量化 + 含全部代码和详细修改方式 + 手撕结构图 + 全网首发

本文将使用DualConv二次创新C2f模块实现轻量化,助力YOLOv10目标检测效果的实践,文中含全部代码、详细修改方式以及手撕结构图。助您轻松理解改进的方法。 改进前和改进后的参数对比: 目录 一 DualConv 1 结合33卷积和11卷积核 2 DualConv 3 可视化 二 C2f_DualConv助…

Python 知识图谱补全,Knowledge Graph Completion,基于大模型的知识图谱补全,基于LLMs的KGC任务

今天讲一篇文章《Exploring Large Language Models for Knowledge Graph Completion》 ,这篇文章主题:基于大模型做知识图谱补全 1.文章主要思想: 本章描述知识图谱补全中的三个任务:三元组分类、关系预测和实体(链接)预测&…

2024Dragon Knight CTF复现web

穿梭隐藏的密钥 知识点:fuzz技术、ssrf、本地绕过、data伪协议、md4弱比较、数组绕过 首先看看页面的源代码,但是发现f12和鼠标右键都被禁用了 用ctrlu查看,发现一个可疑页面 访问看看,发现还是只有一张图,查看源代…

短视频的景别:成都鼎茂宏升文化传媒公司

短视频的景别:探索视觉艺术的魅力 在短视频的浩瀚海洋中,每一个画面都承载着独特的情感和信息。这些画面,通过不同的景别展现,构成了短视频的叙事基础和视觉美感。成都鼎茂宏升文化传媒公司旨在探讨短视频中景别的运用&#xff0…

揭露:抖音外卖区域代理骗局真相,绝不可错过!

自2023年11月23日抖音发布清退服务商的公告后,由官方认证的抖音外卖平台全国代理正式成为历史,而后,抖音外卖平台区域代理接棒,帮助抖音开拓本地生活市场。在此背景下,抖音外卖平台区域代理的申请人数与日俱增&#xf…

AIConnect赋能加持丨AI+DEPIN 共同推动AI发展的技术与运用峰会圆满落幕

6月6日,由AIConnect主办,JuCoin协办的「AIDePIN 共同推动AI发展的技术与应用」峰会在胡志明市圆满落幕!此次活动不仅是AIConnect生态在市场推广和技术应用方面的重要一步,也标志着JuCoin在推动AI与DePIN技术融合中的又一里程碑。 …

算法金 | 这次终于能把张量(Tensor)搞清楚了!

大侠幸会,在下全网同名[算法金] 0 基础转 AI 上岸,多个算法赛 Top [日更万日,让更多人享受智能乐趣] 1. 张量(Tensor)基础概念 1.1 张量的定义与重要性 张量是深度学习中用于表示数据的核心结构,它可以视…

K8s存储对象的使用

背景和概念 容器中的文件在磁盘上是临时存放的,这给在容器中运行较重要的应用带来一些问题: 当容器崩溃或停止时,此时容器状态未保存, 因此在容器生命周期内创建或修改的所有文件都将丢失。另外 在崩溃期间,kubelet 会…

javaWeb4 Maven

Maven-管理和构建java项目的工具 基于POM的概念 1.依赖管理:管理项目依赖的jar包 ,避免版本冲突 2.统一项目结构:比如统一eclipse IDEA等开发工具 3.项目构建:标准跨平台的自动化项目构建方式。有标准构建流程,能快速…

VS2019创建c++动态链接库dll与调用方法

VS2019创建c动态链接库dll与调用方法 1.点击文件-》新建-》项目,输入dll,选择具有导出项的(DLL)动态链接库 2.输入一个文件名:dll2 头文件.h 3.添加加减法函数: // 下列 ifdef 块是创建使从 DLL 导出更简单的 // 宏的标准方法。此 DLL 中的…

【高频】什么是索引的下推和覆盖

面试回答: 索引的下推是指数据库引擎在执行查询时,将过滤条件尽可能地应用到索引上,以减少需要检索的数据量,从而提高查询性能。这样可以减少数据库引擎从磁盘加载的数据量,提高查询效率。覆盖索引是指一个索引包含了…

C++青少年简明教程:C++函数

C青少年简明教程:C函数 C函数是一段可重复使用的代码,用于执行特定的任务,可以提高代码的可读性和可维护性。函数可以接受参数(输入)并返回一个值(输出),也可以没有参数和返回值。 …

范闲获取到庆帝与神庙的往来信件,用AES进行破解

关注微信公众号 数据分析螺丝钉 免费领取价值万元的python/java/商业分析/数据结构与算法学习资料 在《庆余年2》中,范闲与庆帝和神庙之间的权谋斗争愈演愈烈。一次偶然的机会,范闲从庆帝的密室中获取到几封与神庙往来的密信。然而,这封信件…

算法-分治策略

概念 分治算法(Divide and Conquer)是一种解决问题的策略,它将一个问题分解成若干个规模较小的相同问题,然后递归地解决这些子问题,最后合并子问题的解得到原问题的解。分治算法的基本思想是将复杂问题分解成若干个较…

电源变压器的作用和性能

电源变压器的主要作用是改变输入电压的大小,通常用于降低电压或升高电压,以便适应不同设备的需求。它们还可以提供隔离,使得输出电路与输入电路之间电气隔离,从而提高安全性。性能方面,电源变压器需要具有高效率、低温…

二叉树-堆的详解

一,树的概念 1,树的概念 树是一种非线性的数据结构,它是由n(n>0)个有限结点组成一个具有层次关系的集合。 把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。 有…

小学一年级数学上册,我终于学完了

目录 一、背景二、过程1.我对课程中的一些知识的思考2.我对于产品的思考3.我对自己儿子与知识产品结合的思考4.产品反馈的那些有意思的数据 三、总结 一、背景 简约而不简单,即是曾经的再现,也是未来的延伸,未来已来,就在脚下。 …

泛微开发修炼之旅--10基于Ecology实现附件上传,并将上传后的文件id存入表单附件控件中的示例及源码

文章链接:泛微开发修炼之旅--10基于Ecology实现附件上传,并将上传后的文件id存入表单附件控件中的示例及源码