深度分析:智算中心建设 - GPU选型

大模型加持AI技术赛道革新发展,“大模型热”愈演愈烈。2024年2月15日,OpenAI首个视频生成模型Sora发布,完美继承DALL·E 3的画质和遵循指令能力,能生成长达1分钟全尺寸的高清视频。2024年5月14日,OpenAI发布GPT-4o,可以综合利用语音、文本和视觉信息进行推理,并生成文本、音频和图像的任意组合输出。国内厂商也持续更新迭代技术底座及模型能力,Kimi的爆火推动国内大模型竞争,电信星辰TeleChat开源、智谱GLM-4、讯飞星火3.5陆续升级发布。AI发展已经带动GPU行业高速发展,整个数据科学/AI计算几乎全部在GPU上完成。

本文智算中心GPU选型从计算能力应用场景能耗消耗市场生态四个方面分析,为智算中心建设提供不同视角

01计算能力

AI应用场景受GPU算力、GPU显存、显存带宽、GPU互联带宽等主要因素影响。大模型通常使用混合精度进行计算,其中主要参数为FP16和FP32,同时部分计算过程通过减少精度采用INT8加速计算过程;GPU显存制约加载模型及数据量的大小,显存越大可加载的模型数据量越多,显存带宽则制约显存的读写速率;GPU互联不同GPU类型采用不同的互联技术,例如一台8卡NV H100节点内采用NVLink互联,带宽900GB/s, 华为昇腾910B采用HCCS互联,带宽达392GB/s,带宽越高GPU之间模型计算效率越高。

图片

02应用场景

不同类型GPU卡提供不同的算力以及显存、带宽,所适用的AI应用场景也不一样。目前国内主要大模型玩家仍然在卷大模型,参数量和数据集越来越大,所需算力越高,场景化大模型将快速迭代,伴随着AI应用规模落地,推理算力增长空间将高于训练。

对于渲染类的应用场景,部分卡由于提供RT core渲染计算能力,所以能更好的的支持图形、视频等渲染场景,现在比较流行的文生图、图生图、文生视频的AI软件Midjourney/Stable Diffusion都比较适合运行在这种类型卡上。

GPU类型

适用场景

A100/A800

训练、微调和推理场景

H100/H800

训练、微调和推理场景

RTX4090

微调和推理、渲染场景

L40S

训练、微调和推理、渲染场景

H20

训练、微调和推理场景

L20

微调和推理场景

昇腾910B

训练、微调和推理场景

天垓150

训练、微调和推理场景

智铠100

微调和推理场景

曦云C500

训练、微调和推理场景

MTT S4000

微调和推理场景

云燧T21

训练、微调和推理场景

MLU370-X8

微调和推理场景

03能耗消耗

相对于传统的CPU数据中心,智算数据中心需要提供更多的电力来支撑GPU的AI计算,而GPU是耗电大户,也是智算中心运营是否能取得更好收益的关键因素。通常国内发达地区数据中心机房的租赁费用在800-1100元/KW/月,而西部地区租赁费用相对较低,500-800元/KW/月。选择合适的GPU卡,以及更低价的电费将影响智算中心整体收益。

GPU类型

单卡能耗(W)

A100/A800

400

H100/H800

700

RTX4090

450

L40S

350

H20

400

L20

275

昇腾910B

350

天垓150

350

智铠100

150

曦云C500

350

MTT S4000

450

云燧T21

400

MLU370-X8

250

04市场生态

基于业界主流、开源、开放的软件生态建设智算中心,是智算中心能够满足前沿AI计算需求、提升AI创新和生产效率、丰富行业AI应用、促进AI产业快速发展的主要前提。

提及生态,GPU生态的奠基者CUDA是无法绕过的。如今整个科学计算、AI的软件生态大多构建在CUDA的基础之上。CUDA的两大生态护城河:软件库覆盖率、AI框架支持度。CUDA是软件生态的标杆,从软件库的覆盖面、AI框架和算子库的支持程度两方面来讲,都是目前最完善的。CUDA所包含的生态组分众多,包含编程语言和API、开发库、分析和调试工具、数据中心和集群管理工具,以及GPU硬件等多个大类。CUDA软件栈为深度学习的应用开发和计算加速提供了丰富的底层支撑,如张量和卷积计算加速、芯片互联通信加速、数据预处理加速、模型低精度推理加速等。CUDA生态由英伟达主导,国产GPU厂家则各自采用不同架构,通过兼容CUDA或自有生态来满足前沿AI计算需求。例如采用GPGPU架构的天数智芯、沐曦等厂家,采用NPU架构的华为昇腾系列。

选择合适的GPU型号是智算中心成功建设和运营的关键因素,本文从计算能力、应用场景、能耗消耗、市场生态四个方面介绍了不同类型GPU卡的相关特点,为智算中心建设提供参考。

图片

相关阅读:

九州未来受邀参加“浪潮网络2024新品发布暨合作伙伴大会”,分享智算中心建设和运营成果及经验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/788862.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

comsol达西定律的小例子

comsol达西定律的小例子

clean code-代码整洁之道 阅读笔记(第十七章 终章)

大纲 第十七章 味道与启发 17.1 注释 C1:不恰当的信息 C2:废弃的注释 C3:冗余注释 C4:糟糕的注释 C5:注释掉的代码 17.2 环境 E1:需要多步才能实现的构建 E2:需要多步才能做到的测试 …

computed传参

目录 一、问题 二、解决方法 三、总结 tiips:如嫌繁琐,直接移步总结即可! 一、问题 computed可以依据其他变量动态计算出值,但是v-for渲染html时,需要根据html中 传入的不同变量,来分别做处理或者利用 html中的值该…

node+vue的仿网易云音乐网站-计算机毕业设计源码02905

摘要 本论文基于Node.js和Vue.js技术,以仿网易云音乐网站为目标,设计并实现了一个具有音乐播放、歌曲搜索、歌单推荐等功能的音乐网站。首先,论文介绍了网易云音乐网站的特点和功能,分析了其前端和后端技术栈,为后续设…

CTFShow的36D杯

神光 还是想了一下,但那个异或搞不出来,都是对dword_41A038操作,想起开头就给了 key ,还有反调试应该是要调试的 输出的应该就是 flag ,只是为什么是乱码呢? 放 od 再试试,直接就出 flag 了&am…

Docker搭建kafka+zookeeper以及Springboot集成kafka快速入门

参考文章 【Docker安装部署KafkaZookeeper详细教程】_linux arm docker安装kafka-CSDN博客 Docker搭建kafkazookeeper 打开我们的docker的镜像源配置 vim /etc/docker/daemon.json 配置 { "registry-mirrors": ["https://widlhm9p.mirror.aliyuncs.com"…

iPhone数据恢复篇:iPhone 数据恢复软件有哪些

问题:iPhone 15 最好的免费恢复软件是什么?我一直在寻找一个恢复程序来恢复从iPhone中意外删除的照片,联系人和消息,但是我有很多选择。 谷歌一下,你会发现许多付费或免费的iPhone数据恢复工具,声称它们可…

[C++]——同步异步日志系统(3)

同步异步日志系统 一、日志系统框架设计1.1模块划分1.1.1 日志等级模块1.1.2 日志消息模块1.1.3 日志消息格式化模块1.1.4 日志落地模块(日志落地的方向是工厂模式)1.1.5 日志器模块(日志器的生成是建造者模式)1.1.6 异步线程模块…

【HBZ分享】TCP连接完成后又是如何保证数据的可靠性传输

前提 发送发发送数据时,需要给出一个seq编号。第一个数据包的seq编号是一个随机数, 从第二个开始,seq编号就是【第一次的seq数据包大小】, 即接收方响应过来的期待数据包编号 ACK机制 接收方收到数据后,要给发送方回…

Html5前端基本知识整理与回顾下篇

今天我们继续结合发布的Html5基础知识点文档进行复习,希望对大家有所帮助。 目录 列表 无需列表 有序列表 自定义列表 样例 表格 基本属性 ​编辑 相关属性 Border Width Height ​编辑 表格标题 ​编辑 表格单元头 合并单元格 垂直单元格合并 水…

实践致知第12享:如何新建一个Word并设置格式

一、背景需求 小姑电话说:要新建一个Word文档,并将每段的首行设置空2格。 二、解决方案 1、在电脑桌面上空白地方,点击鼠标右键,在下拉的功能框中选择“DOC文档”或“DOCX文档”都可以,如下图所示。 之后&#xff0…

npm install失败,数据源过期

npm install时报错&#xff1a;“Unexpected token &#xff1c; in JSON at position 0 while parsing near ‘&#xff1c;!DOCTYPE html&#xff1e;” 执行Vue2项目安装时&#xff0c;出现报错了&#xff0c;显示ERROr: **npm ERR! Unexpected token < in JSON at posi…

58、基于径向基神经网络的曲线拟合(matlab)

1、基于径向基神经网络的曲线拟合简介及原理 1&#xff09;原理简介 基于径向基神经网络&#xff08;Radial Basis Function Neural Network, RBFNN&#xff09;的曲线拟合是一种常用的非线性拟合方法&#xff0c;通过在输入空间中使用径向基函数对数据进行处理&#xff0c;实…

cesium 雷达扫描

cesium 雷达扫描 (下面附有源码) 实现思路 1、通过改变圆型材质来实现效果, 2、用了模运算和步进函数(step)来创建一个重复的圆形图案 3、当纹理坐标st落在垂直或水平的中心线上时,该代码将改变透明度和颜色,以突出显示这些线 示例代码 <!DOCTYPE html> <ht…

完美解决windows开机时,系统提示此windows副本不是正版的正确解决方法,亲测有效!!!

完美解决windows开机时&#xff0c;系统提示此windows副本不是正版的正确解决方法&#xff0c;亲测有效&#xff01;&#xff01;&#xff01; 亲测有效 完美解决windows开机时&#xff0c;系统提示此windows副本不是正版的正确解决方法&#xff0c;亲测有效&#xff01;&#…

二分查找3

1. 有序数组中的单一元素&#xff08;540&#xff09; 题目描述&#xff1a; 算法原理&#xff1a; 二分查找解题关键就在于去找到数组的二段性&#xff0c;这里数组的二段性是从单个数字a开始出现然后分隔出来的&#xff0c;如果mid落入左半部分那么当mid为偶数时nums[mid1]…

来聊聊Redis持久化AOF管道通信的设计

写在文章开头 最近遇到很多烦心事&#xff0c;希望通过技术来得以放松&#xff0c;今天这篇文章笔者希望会通过源码的方式分析一下AOF如何通过Linux父子进程管道通信的方式保证进行AOF异步重写时还能实时接收用户处理的指令生成的AOF字符串&#xff0c;从而保证尽可能的可靠性…

window 安装 openssl

文章目录 前言window 安装 openssl1. 下载2. 安装3. 配置环境变量4. 测试 前言 如果您觉得有用的话&#xff0c;记得给博主点个赞&#xff0c;评论&#xff0c;收藏一键三连啊&#xff0c;写作不易啊^ _ ^。   而且听说点赞的人每天的运气都不会太差&#xff0c;实在白嫖的话…

LVS集群及其它的NAT模式

1.lvs集群作用&#xff1a;是linux的内核层面实现负载均衡的软件&#xff1b;将多个后端服务器组成一个高可用、高性能的服务器的集群&#xff0c;通过负载均衡的算法将客户端的请求分发到后端的服务器上&#xff0c;通过这种方式实现高可用和负载均衡。 2.集群和分布式&#…