没有人能预料到生成式人工智能(GenAI)会如此迅速地推动英伟达的扩张,也没有人能预料到英伟达的崛起和英特尔的衰落会如此之快。对于那些相信“第二名可以更努力并取得成功”的人来说,AMD的崛起无疑证明了这一点。然而,比“正确”更重要的是,AMD在过去十年中取得的巨大进步,以及它在未来十年中可能带来的变革。
AMD的十年蜕变
2015年,AMD的收入仅为39.9亿美元,其中数据中心产品(主要是面向工业和嵌入式应用的Opteron处理器)的收入仅为约1亿美元。然而,那一年是AMD决定重返服务器X86 CPU市场的关键之年,为后来的Epyc处理器奠定了基础。如今,Epyc处理器已成为市场上性能最高的X86 CPU,并且在性价比上表现出色。
2024年,AMD的收入达到了创纪录的257.9亿美元,同比增长13.7%,净利润为16.2亿美元,同比增长1.9倍,但仅占收入的6.4%。更重要的是,AMD的数据中心业务(包括Epyc CPU、Instinct GPU、Pensando DPU和Xilinx FPGA加速器)收入达到了125.8亿美元,占总收入的48.8%。在2024年的第三和第四季度,数据中心业务贡献了超过一半的收入和近60%的运营利润。
在12月这一季度,AMD总体营收增长24.2%,达到76.6亿美元,但净利润下降27.7%,至4.82亿美元。净利润仅占营收的6.3%,不如去年同期和上一季度,原因是AMD在2024年初兑现了一些税收优惠,而且与一年前相比,现在对未来GPU路线图的投资规模更大。
2024年第四季度,AMD数据中心业务营收达38.6亿美元,同比增长69.1%,环比增长8.7%。数据中心部门运营收入为11.6亿美元,同比增长73.7%。这一运营利润率占营收的30%,比AMD客户端部门笔记本和台式机芯片的利润率高出10多个百分点,是游戏GPU利润率的两倍。
嵌入式业务部门主要包括Xilinx FPGA,还有定制游戏机处理器和显卡,销售额为9.23亿美元,下降12.7%,运营收入为3.62亿美元,下降21.5%。不过,去年FPGA和嵌入式计算业务的运营利润率始终保持在40%,这使其成为AMD最赚钱的业务。
Instinct GPU业务的增长
自2023年以来,AMD的Instinct GPU业务每季度都在增长。2024年,Instinct GPU的销售额突破了50亿美元,远超去年初的保守预测(超过20亿美元)。尽管AMD没有给出2025年第一季度的具体销售指引,但CEO Lisa Su表示,未来几年该业务的年收入将达到“数百亿美元”。
英伟达能从三星、SK海力士和美光科技获得更多HBM内存,从台积电获得更多用于将内存连接到GPU芯片的CoWoS中介层技术。这比任何其他因素都更能决定AMD能生产多少Instinct GPU。我们确信,如果AMD能获得足够的HBM内存和CoWoS技术来制造Instinct显卡,其销量可能会增长10倍。
Instinct MI355X计划提前发布
苏姿丰在电话会议上表示,AMD在第四季度开始批量生产Instinct MI325X GPU加速器,它基于现有MI300A和MI300X GPU加速器中使用的“Ancaster”GPU。MI325X的封装上有256GB HBM3E内存,带宽为6TB/秒,但其原始混合精度计算性能与MI300X相同,MI300X只有192GB HBM3内存,带宽为5.3TB/秒。MI325X的目标竞争对手是英伟达的“Hopper”H200,后者只有141GB HBM3E内存,带宽为4.8TB/秒。
当然,英伟达近一年前就发布了“Blackwell”B100和B200加速器,内存更大的B300也即将推出。因此,AMD将MI355X的推出时间从“2025年下半年某个时间”提前到“年中”,以更好地与英伟达的Blackwell系列竞争。
MI350系列(MI355X是其中一员)基于新的CDNA 4架构,性能将是MI325X的1.8倍。MI325X在FP16精度下为2.3 petaflops,在FP8精度下为4.6 petaflops,在FP6或FP4精度下为9.2 petaflops。CDNA 4架构是AMD首个支持FP6和FP4低精度浮点运算的架构。MI355X有288GB HBM3E内存,带宽为8TB/秒(未开启稀疏性支持)。
英伟达的Blackwell B200有192GB HBM3E内存,带宽为8TB/秒。在未开启稀疏性支持的情况下,B200在FP4精度下的性能为9 petaflops,在FP8精度下为4.5 petaflops,在原始性能上与AMD的产品基本相当,且HBM内存比AMD的产品少。
由此可见,AMD为何将CDNA 4架构从MI400系列GPU提前推出,并急于将MI355X推向市场。
同时,近日AMD也透露了计划2026年推出的Instinct MI400有关消息,从AMD最新的推出的AMD-GFX补丁程序来看,Instinct MI400加速器的设计会有重大变化,MI400将配备两个有源转接层芯片(AID) ,每个AID包含四个加速计算芯片(XCD),现在的MI300系列每个AID包含两个XCD,这么看来MI400将拥有更大的规模。
此外AMD还引入了一个名为多媒体I/O芯片(Multimedia Io Die)的新模块,据说是把多媒体引擎从AID中独立出来,此外还可能包含接口部分的功能。MI400最多包含两个MID,应该是每个AID都有对应的专属MID,与前几代相比,新的设计将提供给计算单元和I/O之间更高效的通信效率。即使在MI350上,AMD也会继续使用IF总线进行芯片间通信,因此这对MI400加速器来说是个重大改变。
总结
AMD在过去十年中取得了显著进步,数据中心业务已成为其收入的主要驱动力。尽管面临英伟达的激烈竞争,AMD通过不断创新和加速产品发布,展现了强大的市场竞争力。未来,随着计算需求的不断演变,AMD有望在数据中心和手持设备领域继续引领潮流。
想了解更多有关AI加速服务器相关的信息,不管是技术问题还是应用规划,欢迎随时联系我们赋创(EMPOWER X),期待能为您提供有价值的见解与支持。