2023算力专题研究:算力租赁算力国产化机会

今天分享的是算力系列深度研究报告:《2023算力专题研究:算力租赁&算力国产化机会》。

(报告出品方:华泰证券)

报告共计:18页

图片

关注算力租赁&算力国产化机会

中美 AI 产业算力层存在差距,算力租赁&算力国产化或为解决办法

美国为本轮 AI 浪潮引领者。从 A 产业的层级看,自下而上包含算力,算法,应用多个层级,其中算力为 AI浪潮的底层支撑,算法为 AI浪潮的重要突破,应用为 AI浪潮的直接体现。从算力、算法、应用端看,美国在本轮 AI 浪潮中处于引领者位置,具备先发优势。

1)算力端: 美国头部厂商如英伟达基于 GPU 产品打造了 CUDA生态,将 GPU能力推向通用计算场景。英伟达打造了 H100 等重要产品,成为本次 A 浪潮的重要算力支撑。

2)算法端:算法层面重要突破同样由美国引领,GPT 底层架构 Transformer 由谷歌首先提出,此外OpenAl 团队将 GPT 模型参数量不断增大,模型进一步涌现出更强的能力。

3) 应用端: 关国头部厂商首先将GPT 为代表的 LLM 能力接入应用,微软、salesforce 等厂商率先实现了LLM+应用的商业化定价及应用。

图片

中美 AI 产业在多个层级上均存在一定差距。横向对比中美 AI 产业,在多个层级上均存在一定的差距。

1) 算力端: 中美 AI 芯片产品存在算力性能及生态差距,此外在芯片的生产端,核心环节如芯片的设计、流片等均由海外主导;

2) 算法端: 海外在基础研究方面较为领先,如谷歌发布底层架构 Transformer 成为 GPT 模型的重要基础。此外海外算法具备先发优势,在迭代次数上也具备一定优势;

3) 应用端: 海外头部应用多已成为行业标准,拥有较为良好的用户基础,有助于 LLM+产品的快速落地,如办公领域的微软 Ofice 产品: 此外海外头部厂商往往基于核心产品打造了完整的产品矩阵及平台,使 AI能力的接入具备车富的场景。

图片

算力是中美 AI 产业具备重要差距的环节。在算法、算力、应用端,中美均存在一定差距, 而其中我们认为当前算力层面的差距较为关键,主要原因:

1)差距大小;差距大小反映的 是当前静态状态下的差距。我们认为当前应用端中美均处于从产品化向商业化过渡的阶段, 算法端通用大模型中 GPT 处于领先地位,但国内同样拥有众多大模型逐步实现产品化,有 望持续迭代,而算力端国内的算力产品在落地方面与海外头部厂商相比仍较为落后;

2)追 赶难度;算力端的核心环节均受海外主导,且规避管制的方式较为有限,此外海外头部算 力厂商围绕自身产品形成了包含应用、算法的生态壁垒,短期难以突破;

3)差距的影响: 算力处于基础支撑地位,直接影响模型的落地和应用的推广进度。

美国法案限制高性能 AI 芯片获取,算力问题逐步凸显。2023 年 10 月 17 日,美国商务部 工业与安全局(BIS)发布针对中国的先进计算及半导体制造物项出口限制,在 2022 年 10 月已公布的出口限制基础上,进一步升级限制力度。具体来看,本次出口限制主要涉及对 高性能芯片的限制,既包括对高性能芯片的出口限制,也包括对国产 GPU 企业的生产流片 限制。本次出口限制不再以互联带宽为限制标准,新增总处理性能 TPP(Total Processing Performance,即计算速度*字节长度)和性能密度 PD(Performance Density,即每平方 毫米的 TPP)两项要求,具体限制方案如下:

1)TPP>4800 的芯片、TPP>1600 且 PD>5.92 的芯片,属于高性能芯片,不再被允许出口;

2)4800>TPP>2400 且 5.92>PD>1.6 的芯片、 TPP>1600 且 5.92>PD>3.2 的芯片,属于次高性能芯片,需要通知 BIS 以获得例外许可。 在美国限制法案的影响下,国内算力问题逐步凸显。

图片

解决算力问题存在多种路径。当前国内解决算力问题存在多种路径。短期内我国厂商在 AI 芯片设计、工艺、生态等方面与英伟达等海外头部厂商相比还有着一定差距,因此短期内 解决算力问题可以通过利用存量可得资源的方式解决,包括:

1)基于现有可用产品;

2) 算力租赁。基于现有可用产品需要海外厂商推出符合法律法规要求的算力产品,算力租赁 则是向具有 GPU 资源的厂商租赁 GPU 算力,最大化利用存量资源。而拉长时间维度后, 我们认为国产自研 AI 芯片有望逐步成为国内 AI 产业发展的重要支撑。

图片

路径#1:算力租赁有望在中短期内缓解算力短缺问题

商业模式: 搭建从 GPU 到大模型的桥渠

算力租赁是一种通过云计算服务提供计算资源租用的商业模式。在这种模式下,用户可以根据实际需求租赁服务器或虚拟机,以满足用户特定的计算需求,而无需购买和维护硬件设备。这种服务模式具有灵活性、高效性和成本效益,适用于各种大规模计算需求的场景。用户能够根据需求即时获取计算资源,无需关心硬件管理和维护,有助于降低总体计算成本。凭借按需获取、灵活性、易于扩展等特性,算力租赁在科学研究、大数据分析和人工智能训练等领域有着广泛应用。

图片

云厂商通常按照用户租赁的 GPU 数量及时长进行收费。以微软 Azure 为例,Azure 基于不同的硬件组合,为下游客户提供不同价格的算力服务。如 ND96asr A100 v4 实例中,采用8片英伟达 A100 GPU,订阅价格按期限分为 10.879、18.829、27.197 美元/小时不同档次,其中一片A100 芯片可以在 TF32 数据格式下,实现 156 TFLOPS 的峰值性能输出。而性能较低的硬件组合,如采用4x V100 的 NC24rs v3 实例,订阅3年的单价约为 4.336 美元/小时,其中一片V100 芯片可以在 FP32 数据格式下,实现 16.4 TFLOPS 的峰值性能输出。

图片

算力粗赁也可按训练实例每月收费。以英伟达 DGX Cloud 为例,英伟达提供基于 DGXA800的算力实例,底层包含 8张 A800 加速卡,总内存大小 640GB,可满足小体量模型的训练/调优需求。除硬件外,DGX Cloud 方案还配有 Base Command Platform 和 NVIDIA AEnterprise 等开发套件,以及 7"24 小时的专家服务,为用户提供全套算力解决方案。基于上述配置,公司按照客户训练模型数量按月收取订阅费,费用为 36999 美元/实例"月。

图片

算力租赁需求方目前以政府部门为主。从算力需求方来看,目前互联网企业大多基于自建 IaaS 云的方式解决内部算力需求问题,如百度、阿里、腾讯等均在 AI 算力领域有所布局。 除互联网企业外,当前国内对 AI 算力投入较多的主体集中在地方政府层面。如 2023 年 10 月 25 日安徽省科技厅发布《安徽省通用人工智能创新发展三年行动计划(2023~2025 年)》, 计划到 2023 年底实现 5000P 算力建设,2024 年实现 12000PFLOPS 算力规模。我们认为, 地方政府作为当前智能算力建设的重要力量,有望引领现阶段的建设节奏,未来随着大模型应用逐步推广,更多行业更多主体有望加入到 AI 算力建设队伍中。

图片

市场空间: 算力租货有望拓展千亿市场

对于算力租赁市场空间,我们在此主要做两方面的测算:

1)收入空间测算;

2)利润空间测算。测算的思路主要从量价关系出发,通过统计目前算力租赁企业公开的订单数据,计算算力租赁市场的平均收益情况。

A系列/H系列8卡服务要性能分别为 5PFLOPS/15.8 PFLOPS。在 Al 大模型训练/推理场景,目前大多厂商采用英伟AIGPU 方案,且以A100、H100 为主流。由于2022年10月17 日,美国商务部对英伟达出口到中国的算力芯片进行了性能限制,故此后国内通过正规途径能买到的 GPU 版本主要为 A800 和 H800系列。以A系列为例,A100与A800 主要差别在于数据传输速率,主要影响大规模组网后的实际性能,但 FP64、FP32 等核心性能参教仍保持一致。以8卡服务器测算,在采用稀疏技术情况下,A100/A800 服务器算力性能为5PFLOPS (FP16),H100/H800 服务器算力性能为 15.8 PFLOPS (FP16)。

图片

我们预计算力租赞单位价格为 1.7 万元/PFLOPS1月。从目前算力租赁公司发布的订单公告情况来看,不同厂商对于同一系列的算力硬件租赁,存在不同收费模式。如根据鸿博股份2023 年 7月7日发布的《鸿博股份有限公司关于对深圳证券交易所关注函回复的公告》,DGX A系列服务器单位算力租赁价格为 3.2万元/PFLOPS/月,而根据中贝通信 2023年9月 19 日发布的《中贝通信集团股份有限公司关于签订 AI 算力服务合同的公告》,A800 服务器单位算力租赁价格为 1 万元/PFLOPS/月。我们预计,产生价格差异的主要原因包括:

1) 不同的服务器制造方案。DGX 系列为英伟达旗下品牌,由英伟达进行整机销售。而部分厂商自行购买 GPU 加速卡,再找代工企业进行服务器组装,成本或更低。

2) 除服务器硬件外,算力租赁成本还包括交换机等网络硬件配置、人员运维等,其他成本的差异也会导致售价不同。

3) 算力租赁企业除提供算力外,往往还搭配调优、造配等软件服务,服务内容差异也会导致租赁价格不同。考虑到上述差异,我们取各厂家平均算力价格 1.7 万元/PFLOPS/月作为算力租赁单价。

图片

IDC 预计 2026 年国内智能算力规模将达 1271.4 EFLOPS。训练与推理数据量增加、模型算法愈加复杂、应用场景的深入和扩展,带来了对算力需求的快速提升。据 IDC,以半精度 (FP16) 运算能力换算,2022 年中国智能算力规模约 268EFLOPS,预计 2026 年智能算力规模将达到 1271EFLOPS,22-26年CAGR将达48%。我们认为,随着大模型持续选代升级和 AIGC 各项应用的落地,市场对训练与推理算力需求与储存需求将持续旺盛增长,算力租赁市场或将迎来增长机遇。

图片

我们预计 2026 年国内算力市场潜在收入空间的为 2628.2 亿元。根据公式: 算力规模X算力租赁单价=算力租赁市场空间,考虑到 2026 年预计国内智能算力规模为 1271.4 EFLOPS(即1271400 PFLOPS)、算力租赁市场平均单位算力价格为 1.7 万元/PFLOPS/月(即 20.4万元/PFLOPS/年),计算得 2026 年国内算力租赁市场潜在收入空间约为 2628.2 亿元。

我们预计 2026 年国内算力市场潜在利润空间约为 754.8 亿元。目前国内算力租赁企业除直接对外出租算力外,也承接算力中心建设项目,根据各公司公告的算力建设规模及合同金额 (已包含配套软硬件及服务),计算得平均单位算力成本为 43.4 万元/PFLOPS。在此基础上,我们假设服务器折旧年限为 3 年,则单位算力毛利润为 1.7x12-43.4/3=5.9 万元/PFLOPS,对应毛利率为 29%。以 2026 年智能算力需求 1271.4 EFLOPS 测算,潜在毛利空间为 754.8 亿元。

图片

竞争壁垒:资金储备、围地拿单、持续运营能力的比拼

竞争壁垒 1: Capex 现金储备。布局算力租赁需要足够的资金储备,以支持算力中心建设和技术研发,根据我们的测算,如果需要建设 10000P 以上的算力中心,光是所需的服务器成本就达到 23.6~33.1 亿元。基于此,对于国内算力租赁企业的资金情况,我们从以下几个维度进行观察:

1) 现金储备: 我们以货币资金+交易性金融资产作为现金储备衡量指标,截至 2023年9月30 日,鸿博股份现金储备 8.6 亿元,恒润股份现金储备 8.35亿元利通电子现金储备 8.32 亿元;

2) 经营性净现金流: 我们认为,经营性净现金流是企业自身业务造血能力的体现。23 年前三季度利通电子经营性净现金流 3.83 亿元,鸿博股份经营性净现金流 0.13 亿元;

3) 增发&转债: 我们认为,资本市场融资能力可以为企业提供充足现金保障。据中贝通信于 2023 年 10 月 17 日发布的《向不特定对象发行可转换公司债券发行公告》,公司发行可转债 5.17 亿元;

4) 股权结构: 恒润股份实控人为济宁市国资委国资背景或为公司带来融资便利,鸿博股份、利通电子等均为民营企业性质。总结来看,鸿博股份、利通电子、恒润股份目前现金储备较为充足。总结来看,我们认为恒润股份、鸿博股份、利通电子目前现金储备较为充足。

图片

竞争壁垒 2:项目订单获取能力。据各公司官网:

1)恒润股份润六尺“东数西算”芜湖集 群规划投资 80 亿,建设完成后可提供 40000P 以上算力。此外,公司计划于上海、福州经 开区、安徽芜湖、山东济宁等地合作建立算力中心,并打造长三角 GPU 算力中心集群。 目前公司已与智谱、百度等大模型厂商签约。

2)汇纳科技与天府云合作算力容量智算中心 项目,全部投产后算力容量规模达 12,000P。汇算智算为汇纳科技与四川并济科技共同合 资成立。

3)中贝通信目前已部署合肥与长三角两个算力中心,计划 2023 年实现 5000P 算 力服务能力,未来三年达成万 P 算力+万卡集群的“双万”战略目标。

4)利通电子子公司 世纪利通自采并已到货的服务器理论上可形成超过 2000P 的集群算力输出。此外,公司仍 有正在执行中的 GPU 服务器采购合同。公司首个超 2000P 算力集群设备已在上海松江腾 讯长三角 AI 超算中心的合作机房就位,正在安装与并机测试。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/184158.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ELK企业级日志分析平台——elasticsearch

集群部署 文档:https://www.elastic.co/guide/en/elasticsearch/reference/7.6/index.html 下载:https://elasticsearch.cn/download/ 主机 ip 角色 k8s1 192.168.92.11 cerebro elk1 192.168.92.31 elasticsearch elk2 192.168.92.32 elasti…

docker启动容器失败,然后查看日志,docker logs查看容器出现报错:

docker 启动容器失败,然后docker logs 查看容器出现报错: error from daemon in stream: Error grabbing logs: invalid character l after object key:value pair在网上看到的 解决方案: 找到你日志文件目录: docker inspect …

在华为昇腾开发板安装gdal-python

作者:朱金灿 来源:clever101的专栏 为什么大多数人学不会人工智能编程?>>> 在华为昇腾开发板安装gdal-python分为两步:编译gdal库和下载gdal对应的python包。 1.编译gdal库 首先下载gdal库,。在linux(arm架构)上编译的gdal库及其第三方库源码,内含一个编译…

Java Web 学习之路(1) —— 前端篇

文章目录 前言1. JS1.1 引入方式1.2 基础语法1.3 函数1.4 对象1.5 事件监听 2. Vue3. Ajax4. Element5. Nginx 前言 在学习后端前,还需要大致了解下前端的一些知识,所以本篇就先快速把前端的一些知识过一遍。本篇不含过多干货和技术知识,仅仅…

杰发科技AC7801——EEP内存分布情况

简介 按照文档进行配置 核心代码如下 /*!* file sweeprom_demo.c** brief This file provides sweeprom demo test function.**//* Includes */ #include <stdlib.h> #include "ac780x_sweeprom.h" #include "ac780x_debugout.h"/* Define …

程序员兼职需要收藏的防坑技巧

不管你是刚刚上车的新职员&#xff0c;还是职场经营多年的老手&#xff0c;在零散时间&#xff0c;通过兼职搞一点零花钱&#xff0c;充实一下自己的生活&#xff0c;这是在正常不过的事情&#xff0c;但是很多同学害怕兼职有风险&#xff0c;被骗或者说找不到门路&#xff0c;…

肌少症合并其他疾病会增加死亡风险 |UK Biobank周报(11.16)

欢迎参加郑老师2023年孟德尔随机化课程即将开始 发表文章后退款&#xff01;郑老师科研统计课程详情 英国生物银行&#xff08;UK Biobank&#xff0c;UKB&#xff09;是英国迄今以来规模最大的有关致病或预防疾病的基因和环境因子的信息资源库。目的是探求一些特定基因、生活方…

Wireshark的捕获过滤器

Wireshark的过滤器&#xff0c;顾名思义&#xff0c;作用是对数据包进行过滤处理。具体过滤器包括捕获过滤器和显示过滤器。本文对捕获过滤器进行分析。 捕获过滤器&#xff1a;当进行数据包捕获时&#xff0c;只有那些满足给定的包含/排除表达式的数据包会被捕获。 捕获过滤器…

外汇天眼:多名投资者账户被恶意清空,远离volofinance!

最近&#xff0c;外汇平台volofinance因有多名投资者投诉&#xff0c;“荣幸”成为外汇天眼黑平台榜单中的一员&#xff0c;那么volofinance到底做了什么导致投资者前来投诉曝光呢&#xff1f; 起底volofinace 在网络搜索中&#xff0c;关于volofinance的信息少之又少&#xf…

Vatee万腾科技的独特力量:Vatee数字时代创新的新视野

在数字化时代的浪潮中&#xff0c;Vatee万腾科技以其独特而强大的创新力量&#xff0c;为整个行业描绘了一幅崭新的视野。这不仅是一场科技创新的冒险&#xff0c;更是对未来数字时代发展方向的领先探索。 Vatee万腾将创新视为数字时代发展的引擎&#xff0c;成为推动行业向前的…

千万不能下载当当网客户端或者去当当网购物

这个是当当网价格&#xff1a;89块 这是拼多多包含品质险的价格&#xff1a;60元 可以看到从当当网网址里面去买同样的一本书要比在拼多多买贵20块钱 下面这个是从淘宝买的价格&#xff0c;可以看到当当网和淘宝的价格都比拼多多贵了20块钱 当当网的套路是&#xff1a;在其他的…

文章解读与仿真程序复现思路——中国电机工程学报EI\CSCD\北大核心《计及电动汽车需求响应的高速公路服务区光储充鲁棒优化配置》

这个标题涉及到一个关于高速公路服务区的优化配置问题&#xff0c;其中考虑了电动汽车需求响应和光储充的因素。让我们逐步解读这个标题&#xff1a; 高速公路服务区&#xff1a; 涉及到高速公路上的服务区&#xff0c;这是供驾驶员休息、加油、用餐等的地方。 电动汽车需求响…

【TensorRT部署】pytorch模型(pt/pth)转onnx,onnx转engine(tensorRT)

1. 单帧处理 1. pt2onnx import torch import numpy as np from parameters import get_parameters as get_parameters from models._model_builder import build_model TORCH_WEIGHT_PATH ./checkpoints/model.pth ONNX_MODEL_PATH ./checkpoints/model.onnx torch.set_de…

GoogleNet详解

一、亮点 AlexNet、VGG都只有一个输出层。googlenet有三个&#xff08;其中两个是辅助分类层&#xff09; 二、先看看Inception结构 1、Inception 之前的网络&#xff1a; AlexNet、VGG都是串行结构 Inception&#xff1a; 并行结构 上一层的输出同时传入四个并行结构&…

中西部各省市翻译协会、公关协会会长金秋圆桌会议圆满结束

中西部翻译协会共同体、中西部公共关系协会共同体共同体创建8年来&#xff0c;已成功举办了八届翻译大赛。时值第九届中西部翻译大赛将拉开序幕&#xff0c;中西部翻译协会共同体、中西部公共关系协会共同体举办的2023年度中西部各省市翻译协会、公关协会会长金秋圆桌会议&…

如何用python画一个圣诞树

前言 距离圣诞节还有一个月啦。今天&#xff0c;我们给大家画一个圣诞树&#xff0c;我们一起来看看效果吧。 效果展示 我们先来看看最终的效果看看我们画的圣诞树怎么样吧。如果&#xff0c;感觉不错&#xff0c;我们一起来实现吧。 功能实现 功能模块 我们先看看&#x…

Bytebase 2.11.1 - 数据脱敏支持语义类型和脱敏算法

&#x1f680; 新功能 数据脱敏支持自定义脱敏算法和语义类型。 &#x1f514; 重大变更 用户页面的 URL 由 /u/{uid} 变更为 /users/{email}。工作空间的所有者和开发者分别更名为&#xff1a;管理员和成员。 &#x1f384; 改进 SQL 编辑器支持显示表的 DDL 语句&#…

HR8833 双通道H桥电机驱动芯片

HR8833为玩具、打印机和其它电机一T化应用提供一种双通道电机驱动方案。HR8833提供两种封装&#xff0c;一种是带有L露焊盘的TSSOP-16封装&#xff0c;能改进散热性能&#xff0c;且是无铅产品&#xff0c;引脚框采用100&#xff05;无锡电镀。另一种封装为SOP16&#xff0c;不…

【ARM CoreLink 系列 3.2 -- CCI-400,CCI-500, CCI-550 差异】

文章目录 CCI-400 和 CCI-500 差异ARM CCI-400ARM CCI-500ARM CCI-550CCI-400 和 CCI-500 差异 ARM的 CCI(Cache Coherent Interconnect)系列产品是用于多核处理器之间的高性能缓存一致性互连。CCI-400 和 CCI-500 是该系列中的两种设计,它们旨在允许多个处理器核心和其他资…

【腾讯云云上实验室-向量数据库】Tencent Cloud VectorDB在实战项目中替换Milvus测试

为什么尝试使用Tencent Cloud VectorDB替换Milvus向量库&#xff1f; 亮点&#xff1a;Tencent Cloud VectorDB支持Embedding&#xff0c;免去自己搭建模型的负担&#xff08;搭建一个生产环境的模型实在耗费精力和体力&#xff09;。 腾讯云向量数据库是什么&#xff1f; 腾…