深度解读英伟达新一轮对华特供芯片H20、L20、L2的定位



大家好,我是极智视界,欢迎关注我的公众号,获取我的更多前沿科技分享

邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码和资源下载,链接:https://t.zsxq.com/0aiNxERDq

因为一直从事 AI 工作,所以对于英伟达的卡会关注的比较多,从刚入行时候的 TITAN 到 20、30、40、A100、H100,从 T4 到 A10、L4,大多都接触过 (当然除了 H100)。这次英伟达要给咱们特供芯片,不是首次,上一次是特供版的 A800、H800,那时候的禁令里边还没有算力密度的限制,所以 A800、H800 也是满算力的,只是带宽给降低了。后来,美国升级了尖端芯片禁令,加入了算力密度 PD 的限制,一方面直接限制了 A800、H800 的出售,另一方面还间接抑制了咱们的 Chiplet 芯粒堆叠技术突破的可能性。这样一来,限制可谓是全方位的。关于这方面,我之前写过一篇解读 <极智AI | 老美升级芯片禁令限制中的性能指标到底指什么>,有兴趣的同学可以去看看。

对于英伟达,一家以利益为先的商业企业,虽然只能 "服从安排",但是肯定不甘,也只能见招拆招了。所以这又一次特供的三款芯片,肯定会照着最新的芯片法案,好好读透它然后绕开它。说实话其实很难绕,因为限制的很死,估计只能阉割降算力。这里需要注意的一点是,对于禁令中的算力限制,主要是针对浮点算力,浮点算力是干嘛的大家应该清楚,说白了就是限制 AI 训练。

从三块型号 H20、L20、L2 来看,H20 应该是训练卡,而 L20、L2 应该是推理卡,H20 基于最新的 Hopper 架构,而 L20、L2 则基于 Ada 架构。来看这几款芯片的性能参数,

据我所知,同为 Ada 架构 L 推理系列的 L4 并没有被禁 (禁的只是 L40S),所以上面的表格中我也特意加入了 NVIDIA L4 的性能数据,以方便直接对比,这样看其实 L20 和 L2 的定位就会比较尴尬一些。先来看 L20、L2 的定位,从性能参数来看,L20 基本会是 2x 的 L2,而 L2 一定会是张半高半长的计算卡,这么看 L20 应该是张全高全长的加速卡。L20 应该会是阉割版的 L40,产品形态应该和 L40 长得一致,如下,

而 L2 会是阉割版的 L4,产品形体应该和 L4 的一致,如下,

我翻了下上一代全高全长卡 A10 的参数,基本上这次的 L20 和上一代 A10 会持平 (L20 的显存带宽会高一点),这样的水平定位应该会比较清楚了。因为 A10 现在还是比较容易可以买到的,所以这对于你是否会入 L20 是个参考。而对于 L2,它的定位应该是介于 T4 和 L4 之间的一款计算卡,它的 INT8 Tensor Core 算力 193 TOPS,也是会介于 L4 485 TOPS 和 T4 130 TOPS 之间的。L2 的功耗虽然网上没有数据,但是很好猜测,估计在 70 ~ 75W 之间,这是这个级别推理卡的标配。这样,对于 L2 的选购也有了一定的参考。

咱们再来分析 H20 的定位,H20 是明显这几款加速卡中最先进的那个,因为它是 Hopper 架构,而其他是 Ada 架构。而从目前的市面上来看,Hopper 架构的卡除了 RTX 40 消费级显卡外,专业的计算卡你是买不到的,所以 H20 必定是个稀罕货。从算力、功耗、互联来看,H20 主要用于训练,而其他主要用于推理;而从显存、显存带宽、浮点算力、MIG、编解码能力、是否支持 NVLink 互联等综合来看,明显 H20 和其他卡不在一个层次 (当然直接用训练卡和推理卡这么对比是不公平的)。由于 A100、H100、A800、H800 被禁了,高端的训练卡是咱们最缺的,是紧俏货,所以 H20 会很香。对于英伟达来说,H20 应该会比 L20、L2 好卖太多;但对老美来说,他们知道我们缺的是什么,他们知道我们想要的是什么。我们想要什么,他们就越不想给。

L20、L2 不是咱们的急需,也不是咱们的痛点。对于这类推理卡,咱们有很多选择的余地,比如 NVIDIA L4、比如咱们一众的国产推理卡。甚至从这个角度,英伟达特供的 L20、L2,对咱们来说并算不上什么 "好事"。怎么说呢,目前 NVIDIA T4 卡已经停产挺久,各厂家都在推 "更新换代",若要用英伟达的卡就基本是要往前推上 L4,而 L4 的性能基本是 T4 的三倍左右,这个跨度还是挺大的。而咱们国产的推理卡,基本就是对标 T4,对于用户来说由于很多场景可能已经适应 T4 的算力,再加上性价比、国产化替代的考虑,使用国产卡平替 T4 可能会是个不错的选择。而 L20、L2 的推出,又给 T4 的 "国产化替代" 带来了一些不确定性。对于更多会考虑生态、考虑可用性、而非国产化替代的产商来说,本来可能是会考虑选择国产卡,但现在来说,L2、L20 似乎是个更加不错的选择,因为这样你的软件生态就能直接延续下来,而不用大规模重新开发。

而 H20 的情况则完全完全不同,国产卡做的比较好的、比较能够拿得出手的主要在推理卡,对于训练卡,大规模商业化的并不算多,大家可能熟知一些是昇腾 910、昇腾910b 这些。对于训练卡,在禁令下各种高端 NVIDIA 训练卡禁售的情况下,加上国产卡平替的一言难尽,国内高端训练卡的供需情况可想而知,若用 "饥渴" 来形容也不为过。所以,对于咱们来说,L20、L2 是个锦上添花的东西,而 H20 是真正雪中送炭的东西。

但从目前的消息来看,英伟达会推迟面向咱们销售 H20,此番深意,你可细品,便略知一二。


【极智视界】

《深度解读英伟达新一轮对华特供芯片H20、L20、L2的定位》

畅享人工智能的科技魅力,让好玩的AI项目不难玩。邀请您加入我的知识星球,星球内我精心整备了大量好玩的AI项目,皆以工程源码形式开放使用,涵盖人脸、检测、分割、多模态、AIGC、自动驾驶、工业等。一定会对你学习有所帮助,也一定非常好玩,并持续更新更加有趣的项目。https://t.zsxq.com/0aiNxERDq

​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/187053.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux——使用kill结束进程并恢复进程

目录 查看进程结束进程修复进程 查看进程 在linux中&#xff0c;关闭某进程之前先查看已经在运行的进程有哪些&#xff0c;使用下面命令查看&#xff1a; ps aux | grep -i apt 命令查看哪个进程正在使用 apt结束进程 结束某线程的命令为&#xff1a; sudo kill -9 PID 命令…

【LeetCode】每日一题 2023_11_25 二叉树中的伪回文路径(dfs,数组/位运算)

文章目录 刷题前唠嗑题目&#xff1a;二叉树中的伪回文路径题目描述代码与解题思路偷看大佬题解 结语 刷题前唠嗑 LeetCode&#xff1f;启动&#xff01;&#xff01;&#xff01; 这个月第一次周末早起~ 题目&#xff1a;二叉树中的伪回文路径 题目链接&#xff1a;1457. 二…

基于UI交互意图理解的异常检测方法

美团到店平台技术部/质量工程部与复旦大学周扬帆教授团队开展了科研合作&#xff0c;基于业务实际场景&#xff0c;自主研发了多模态UI交互意图识别模型以及配套的UI交互框架。 本文从大前端质量保障领域的痛点出发&#xff0c;介绍了UI交互意图识别的方法设计与实现。基于UI交…

类和对象(3)日期类的实现

日期类的实现 一&#xff0c;声明二&#xff0c;函数成员定义2.1构造函数2.2获取月份天数2.3比较运算符2.3.1等于和大于2.3.2其他 2.4计算运算符2.4.1 &&2.4.2-&&- 2.5日期-日期 一&#xff0c;声明 class Date { public:Date(int year 1, int month 1, int…

【鸿蒙应用ArkTS开发系列】- 云开发入门实战二 实现省市地区三级联动地址选择器组件(上)

目录 概述 云数据库开发 一、创建云数据库的对象类型。 二、预置数据&#xff08;为对象类型添加数据条目&#xff09;。 三、部署云数据库 云函数实现业务逻辑 一、创建云函数 二、云函数目录讲解 三、创建resources目录 四、获取云端凭据 五、导出之前创建的元数据…

Chatbot开发三剑客:LLAMA、LangChain和Python

聊天机器人&#xff08;Chatbot&#xff09;开发是一项充满挑战的复杂任务&#xff0c;需要综合运用多种技术和工具。在这一领域中&#xff0c;LLAMA、LangChain和Python的联合形成了一个强大的组合&#xff0c;为Chatbot的设计和实现提供了卓越支持。 首先&#xff0c;LLAMA是…

Netty实现websocket且实现url传参的两种方式(源码分析)

1、先构建基本的netty框架 再下面的代码中我构建了一个最基本的netty实现websocket的框架&#xff0c;其他个性化部分再自行添加。 Slf4j public class TeacherServer {public void teacherStart(int port) throws InterruptedException {NioEventLoopGroup boss new NioEve…

借助 XEOS V6, 农牧龙头企业实现原有存储的高效在线替换

面对旧有存储系统的应用不足&#xff0c;某大型现代农牧龙头企业采用了星辰天合的对象存储 XEOS V6 方案&#xff0c; 该方案以其卓越的技术架构和同城双活异地灾备的解决方案完整性&#xff0c;在无缝高效完成系统替换的同时&#xff0c;可以极大地提升系统的灵活性和业务的连…

VMware Workstation Pro 安装虚拟机,无法打开此虚拟机电源 因为它需要使用x86架构,架构冲突

本来我下的iso文件&#xff0c;可以看到他是64的&#xff0c;但是ubuntu没有86的&#xff0c;我只能去下载cenos的 用这个去安装虚拟机就好了

虹科Pico汽车示波器 | 汽车免拆检修 | 2011款瑞麒M1车发动机起动困难、加速无力

一、故障现象 一辆2011款瑞麒M1车&#xff0c;搭载SQR317F发动机&#xff0c;累计行驶里程约为10.4万km。该车因发动机起动困难、抖动、动力不足、热机易熄火等故障进厂维修。用故障检测仪检测&#xff0c;发动机控制单元&#xff08;ECU&#xff09;中存储有故障代码“P0340相…

0003Java程序设计-ssm基于微信小程序的家教信息管理系统

文章目录 摘要目 录系统实现开发环境 编程技术交流、源码分享、模板分享、网课分享 企鹅&#x1f427;裙&#xff1a;776871563 摘要 本文讲述了基于微信小程序的家教信息管理系统的设计与实现。结合线上管理的特点&#xff0c;分析了家教信息管理系统的现状&#xff0c;给出…

Shell编程基础 – 变量(Variables)

Shell编程基础 – 变量&#xff08;Variables&#xff09; Shell Scripting Essentials – Variables Bash变量作为shell脚本的重要组成部分&#xff0c;提供了在Unix/Linux命令行界面操作和保存数据的方法。 本文简要介绍Bash Shell脚本变量的基础知识以及应用&#xff0c;包…

Android Studio 显示build variants工具栏

工具栏&#xff1a; 如下图所示 依次点击View-->ToolWindows-->Build Variants。 在此记个笔记

Hadoop实践指南:揭秘HDFS元数据并解析案例

1.什么是元数据 元数据&#xff08;Metadata&#xff09;&#xff0c;描述数据的数据&#xff08;data about data&#xff09;。 1.1 HDFS元数据 元数据&#xff1a;关于文件或目录的描述信息&#xff0c;如文件所在路径、文件名称、文件类型等等&#xff0c;这些信息称为文…

【开源】基于JAVA的车险自助理赔系统

项目编号&#xff1a; S 018 &#xff0c;文末获取源码。 \color{red}{项目编号&#xff1a;S018&#xff0c;文末获取源码。} 项目编号&#xff1a;S018&#xff0c;文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 角色管理模块2.3 车…

如何在没有备份的情况下恢复 iPhone 上已删除的短信

要在没有备份的情况下恢复 iPhone 上已删除的消息&#xff0c;您可以从“消息”应用程序恢复它们或使用第三方数据恢复工具。 虽然我们的 iPhone 可以做很多事情&#xff0c;但我在设备上最常做的事情之一就是文本。无论我是与朋友或家人联系&#xff0c;还是分享重要信息&…

从Redis反序列化UserDetails对象异常后发现FastJson序列化的一些问题

最近在使用SpringSecurityJWT实现认证授权的时候&#xff0c;出现Redis在反序列化userDetails的异常。通过实践发现&#xff0c;使用不同的序列化方法和不同的fastJson版本&#xff0c;异常信息各不相同。所以特地记录了下来。 一、项目代码 先来看看我项目中redis相关配置信息…

【Spring日志】

一.日志作用 1.定位和发现问题 这是日志的主要用途,通过查看日志,我们可以定位问题发生的位置,从而快速的发现问题,分析问题. 2.系统监控 监控几乎是一个成熟系统的标配,我们可以通过日志记录这个系统的运行状态,比如记录方法的响应时间,响应状态,通过设置不同的规则,超过阈值就…

递归算法学习——二叉树的伪回文路径

1&#xff0c;题目 给你一棵二叉树&#xff0c;每个节点的值为 1 到 9 。我们称二叉树中的一条路径是 「伪回文」的&#xff0c;当它满足&#xff1a;路径经过的所有节点值的排列中&#xff0c;存在一个回文序列。 请你返回从根到叶子节点的所有路径中 伪回文 路径的数目。 示例…

python-选择排序

选择排序是一种简单直观的排序算法&#xff0c;它的基本思想是每一轮选择未排序部分的最小元素&#xff0c;然后将其放到已排序部分的末尾。这个过程持续进行&#xff0c;直到整个数组排序完成。(重点&#xff1a;通过位置找元素) 以下是选择排序的详细步骤和 Python 实现&…