AMD数据中心业务创纪录,Instinct MI355X提前发布

没有人能预料到生成式人工智能(GenAI)会如此迅速地推动英伟达的扩张,也没有人能预料到英伟达的崛起和英特尔的衰落会如此之快。对于那些相信“第二名可以更努力并取得成功”的人来说,AMD的崛起无疑证明了这一点。然而,比“正确”更重要的是,AMD在过去十年中取得的巨大进步,以及它在未来十年中可能带来的变革。
在这里插入图片描述

AMD的十年蜕变

2015年,AMD的收入仅为39.9亿美元,其中数据中心产品(主要是面向工业和嵌入式应用的Opteron处理器)的收入仅为约1亿美元。然而,那一年是AMD决定重返服务器X86 CPU市场的关键之年,为后来的Epyc处理器奠定了基础。如今,Epyc处理器已成为市场上性能最高的X86 CPU,并且在性价比上表现出色。
在这里插入图片描述
2024年,AMD的收入达到了创纪录的257.9亿美元,同比增长13.7%,净利润为16.2亿美元,同比增长1.9倍,但仅占收入的6.4%。更重要的是,AMD的数据中心业务(包括Epyc CPU、Instinct GPU、Pensando DPU和Xilinx FPGA加速器)收入达到了125.8亿美元,占总收入的48.8%。在2024年的第三和第四季度,数据中心业务贡献了超过一半的收入和近60%的运营利润。
在这里插入图片描述

在12月这一季度,AMD总体营收增长24.2%,达到76.6亿美元,但净利润下降27.7%,至4.82亿美元。净利润仅占营收的6.3%,不如去年同期和上一季度,原因是AMD在2024年初兑现了一些税收优惠,而且与一年前相比,现在对未来GPU路线图的投资规模更大。

2024年第四季度,AMD数据中心业务营收达38.6亿美元,同比增长69.1%,环比增长8.7%。数据中心部门运营收入为11.6亿美元,同比增长73.7%。这一运营利润率占营收的30%,比AMD客户端部门笔记本和台式机芯片的利润率高出10多个百分点,是游戏GPU利润率的两倍。
在这里插入图片描述
嵌入式业务部门主要包括Xilinx FPGA,还有定制游戏机处理器和显卡,销售额为9.23亿美元,下降12.7%,运营收入为3.62亿美元,下降21.5%。不过,去年FPGA和嵌入式计算业务的运营利润率始终保持在40%,这使其成为AMD最赚钱的业务。

Instinct GPU业务的增长

自2023年以来,AMD的Instinct GPU业务每季度都在增长。2024年,Instinct GPU的销售额突破了50亿美元,远超去年初的保守预测(超过20亿美元)。尽管AMD没有给出2025年第一季度的具体销售指引,但CEO Lisa Su表示,未来几年该业务的年收入将达到“数百亿美元”。

英伟达能从三星、SK海力士和美光科技获得更多HBM内存,从台积电获得更多用于将内存连接到GPU芯片的CoWoS中介层技术。这比任何其他因素都更能决定AMD能生产多少Instinct GPU。我们确信,如果AMD能获得足够的HBM内存和CoWoS技术来制造Instinct显卡,其销量可能会增长10倍。
在这里插入图片描述

Instinct MI355X计划提前发布

苏姿丰在电话会议上表示,AMD在第四季度开始批量生产Instinct MI325X GPU加速器,它基于现有MI300A和MI300X GPU加速器中使用的“Ancaster”GPU。MI325X的封装上有256GB HBM3E内存,带宽为6TB/秒,但其原始混合精度计算性能与MI300X相同,MI300X只有192GB HBM3内存,带宽为5.3TB/秒。MI325X的目标竞争对手是英伟达的“Hopper”H200,后者只有141GB HBM3E内存,带宽为4.8TB/秒。
在这里插入图片描述
当然,英伟达近一年前就发布了“Blackwell”B100和B200加速器,内存更大的B300也即将推出。因此,AMD将MI355X的推出时间从“2025年下半年某个时间”提前到“年中”,以更好地与英伟达的Blackwell系列竞争。

MI350系列(MI355X是其中一员)基于新的CDNA 4架构,性能将是MI325X的1.8倍。MI325X在FP16精度下为2.3 petaflops,在FP8精度下为4.6 petaflops,在FP6或FP4精度下为9.2 petaflops。CDNA 4架构是AMD首个支持FP6和FP4低精度浮点运算的架构。MI355X有288GB HBM3E内存,带宽为8TB/秒(未开启稀疏性支持)。
在这里插入图片描述

英伟达的Blackwell B200有192GB HBM3E内存,带宽为8TB/秒。在未开启稀疏性支持的情况下,B200在FP4精度下的性能为9 petaflops,在FP8精度下为4.5 petaflops,在原始性能上与AMD的产品基本相当,且HBM内存比AMD的产品少。

由此可见,AMD为何将CDNA 4架构从MI400系列GPU提前推出,并急于将MI355X推向市场。

同时,近日AMD也透露了计划2026年推出的Instinct MI400有关消息,从AMD最新的推出的AMD-GFX补丁程序来看,Instinct MI400加速器的设计会有重大变化,MI400将配备两个有源转接层芯片(AID) ,每个AID包含四个加速计算芯片(XCD),现在的MI300系列每个AID包含两个XCD,这么看来MI400将拥有更大的规模。
在这里插入图片描述
此外AMD还引入了一个名为多媒体I/O芯片(Multimedia Io Die)的新模块,据说是把多媒体引擎从AID中独立出来,此外还可能包含接口部分的功能。MI400最多包含两个MID,应该是每个AID都有对应的专属MID,与前几代相比,新的设计将提供给计算单元和I/O之间更高效的通信效率。即使在MI350上,AMD也会继续使用IF总线进行芯片间通信,因此这对MI400加速器来说是个重大改变。
在这里插入图片描述

总结

AMD在过去十年中取得了显著进步,数据中心业务已成为其收入的主要驱动力。尽管面临英伟达的激烈竞争,AMD通过不断创新和加速产品发布,展现了强大的市场竞争力。未来,随着计算需求的不断演变,AMD有望在数据中心和手持设备领域继续引领潮流。

想了解更多有关AI加速服务器相关的信息,不管是技术问题还是应用规划,欢迎随时联系我们赋创(EMPOWER X),期待能为您提供有价值的见解与支持。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/964827.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C++ 中的 `string` 类型:全面解析与高效操作

C 中的 string 类型:全面解析与高效操作 在 C 中,string 类型是对字符数组的高级封装,它提供了大量内置函数,使得字符串的处理变得更为简便和高效。与 C 风格的字符数组不同,string 类型不仅自动管理内存,…

穷举vs暴搜vs深搜vs回溯vs剪枝系列一>黄金矿工

目录 决策树&#xff1a;代码设计代码&#xff1a; 决策树&#xff1a; 代码设计 代码&#xff1a; class Solution {boolean[][] vis;int ret,m,n;public int getMaximumGold(int[][] grid) {m grid.length;n grid[0].length;vis new boolean[m][n]; for(int i 0; i <…

DeepSeek 的含金量还在上升

大家好啊&#xff0c;我是董董灿。 最近 DeepSeek 越来越火了。 网上有很多针对 DeepSeek 的推理测评&#xff0c;除此之外&#xff0c;也有很多人从技术的角度来探讨 DeepSeek 带给行业的影响。 比如今天就看到了一篇文章&#xff0c;探讨 DeepSeek 在使用 GPU 进行模型训练…

使用SpringBoot发送邮件|解决了部署时连接超时的bug|网易163|2025

使用SpringBoot发送邮件 文章目录 使用SpringBoot发送邮件1. 获取网易邮箱服务的授权码2. 初始化项目maven部分web部分 3. 发送邮件填写配置EmailSendService [已解决]部署时连接超时附&#xff1a;Docker脚本Dockerfile创建镜像启动容器 1. 获取网易邮箱服务的授权码 温馨提示…

两种文件类型(pdf/图片)打印A4半张纸方法

环境:windows10、Adobe Reader XI v11.0.23 Pdf: 1.把内容由横排变为纵排&#xff1a; 2.点击打印按钮&#xff1a; 3.选择打印页范围和多页&#xff1a; 4.内容打印在纸张上部 图片&#xff1a; 1.右键图片点击打印&#xff1a; 2.选择打印类型&#xff1a; 3.打印配置&am…

C语言打印输出星号图形(三角形、菱形、漏斗)

文章目录 1. 介绍2. 案例分析3. 漏斗型4. 直角三角形4.1 左上直角三角形4.2 右上直角三角形4.3 左下直角三角形4.4 右下直角三角形 5. 等腰三角形5.1 正等腰三角形5.2 倒等腰三角形 6. 平行四边形6.1 纵向左下平行四边形6.2 纵向左上平行四边形6.3 横向左上平行四边形6.4 横向左…

刷题记录 动态规划-7: 63. 不同路径 II

题目&#xff1a;63. 不同路径 II 难度&#xff1a;中等 给定一个 m x n 的整数数组 grid。一个机器人初始位于 左上角&#xff08;即 grid[0][0]&#xff09;。机器人尝试移动到 右下角&#xff08;即 grid[m - 1][n - 1]&#xff09;。机器人每次只能向下或者向右移动一步。…

springboot+vue+uniapp的校园二手交易小程序

开发语言&#xff1a;Java框架&#xff1a;springbootuniappJDK版本&#xff1a;JDK1.8服务器&#xff1a;tomcat7数据库&#xff1a;mysql 5.7&#xff08;一定要5.7版本&#xff09;数据库工具&#xff1a;Navicat11开发软件&#xff1a;eclipse/myeclipse/ideaMaven包&#…

Python 自学秘籍:开启编程之旅,人生苦短,我用python。

从2009年&#xff0c;用了几次python后就放弃了&#xff0c;一直用的php&#xff0c;现在人工智能时代&#xff0c;完全没php什么事情。必须搞python了&#xff0c;虽然已经40多岁了。死磕python了。让滔滔陪着你一起学python 吧。 开启新世界 在当今人工智能化的时代&#xff…

react的antd表格自定义图标

将原版的加号换成箭头 自定义图标 安装图标包&#xff1a; npm install --save ant-design/icons 引入&#xff1a; import { RightOutlined, DownOutlined } from ant-design/icons; 参数是一个函数 <Table columns{columns} dataSource{data} indentSize{20}expandIc…

chrome浏览器chromedriver下载

chromedriver 下载地址 https://googlechromelabs.github.io/chrome-for-testing/ 上面的链接有和当前发布的chrome浏览器版本相近的chromedriver 实际使用感受 chrome浏览器会自动更新&#xff0c;可以去下载最新的chromedriver使用&#xff0c;自动化中使用新的chromedr…

Vim的基础命令

移动光标 H(左) J(上) K(下) L(右) $ 表示移动到光标所在行的行尾&#xff0c; ^ 表示移动到光标所在行的行首的第一个非空白字符。 0 表示移动到光标所在行的行首。 W 光标向前跳转一个单词 w光标向前跳转一个单词 B光标向后跳转一个单词 b光标向后跳转一个单词 G 移动光标到…

算法与数据结构(括号匹配问题)

思路 从题干可以看出&#xff0c;只要给出的括号对应关系正确&#xff0c;那么就可以返回true,否则返回false。这个题可以使用栈来解决 解题过程 首先从第一个字符开始遍历&#xff0c;如果是括号的左边&#xff08;‘&#xff08;‘&#xff0c;’[‘&#xff0c;’}‘&…

deepseek、qwen等多种模型本地化部署

想要在本地部署deepseek、qwen等模型其实很简单,快跟着小编一起部署吧 1 环境搭建 1.1下载安装环境 首先我们需要搭建一个环境ollama,下载地址如下 :Ollama 点击Download 根据自己电脑的系统选择对应版本下载即可 1.2 安装环境(window为例) 可以直接点击安装包进行安…

(2025,LLM,下一 token 预测,扩散微调,L2D,推理增强,可扩展计算)从大语言模型到扩散微调

Large Language Models to Diffusion Finetuning 目录 1. 概述 2. 研究背景 3. 方法 3.1 用于 LM 微调的高斯扩散 3.2 架构 4. 主要实验结果 5. 结论 1. 概述 本文提出了一种新的微调方法——LM to Diffusion (L2D)&#xff0c;旨在赋予预训练的大语言模型&#xff08;…

一款wordpress AI免费插件自动内容生成+前端AI交互+文章批量采集

一款wordpressAI自动内容生成前端AI会话窗口交互文章批量采集免费插件 1. SEO优化文章生成 关键词驱动的内容生成&#xff1a;用户可以输入关键词或长尾关键词&#xff0c;插件会根据这些关键词生成高质量的SEO优化文章。文章结构清晰&#xff0c;语言自然流畅&#xff0c;符合…

2024年12月 Scratch 图形化(一级)真题解析 中国电子学会全国青少年软件编程等级考试

202412 Scratch 图形化&#xff08;一级&#xff09;真题解析 中国电子学会全国青少年软件编程等级考试 一、单选题(共25题&#xff0c;共50分) 第 1 题 点击下列哪个按钮&#xff0c;可以将红框处的程序放大&#xff1f;&#xff08; &#xff09; A. B. C. D. 标…

Java面试题集合篇5:10道基础面试题——保姆级详细图文、代码解释

文章目录 前言41、多线程场景下使用 ArrayList42、List 和 Set 区别43、HashSet 实现原理44、HashSet检查重复和保证数据不可重复45、BlockingQueue46、Map接口46.1、HashMap 实现原理46.2、HashMap在JDK1.7和JDK1.8中不同点46.3、JDK1.7 VS JDK1.8 比较 47、HashMap的put方法流…

2022年全国职业院校技能大赛网络系统管理赛项模块A:网络构建(样题2)-网络部分解析-附详细代码

目录 附录1:拓扑图​编辑 附录2:地址规划表 1.SW1 2.SW2 3.SW3 4.SW4 5.SW5 6.SW6 7.SW7 8.R1 9.R2 10.R3 11.AC1 12.AC2 13.EG1 14.EG2 15.AP2 16.AP3 附录1:拓扑图 附录2:地址规划表

优化数据库结构

MySQL学习大纲 一个好的数据库设计方案对于数据库的性能尝尝会起到事倍功半的效果&#xff0c;合理的数据库结构不仅使数据库占用更小的磁盘空间&#xff0c;而且使查询速度更快。数据库结构的设计需要考虑数据冗余、查询和更新速度、字段的数据类型是否合理等多方面的内容&…