我们是否需要AI服务器?推动人工智能繁荣发展的AI服务器

揭穿人工智能服务器的炒作

人工智能的研究已经有几十年了,早在 1960 年代,生成式人工智能就已应用于聊天机器人。然而,2022 年 11 月 30 日发布的 ChatGPT 聊天机器人和虚拟助手席卷了 IT 界,让 GenAI 成为家喻户晓的术语,并掀起了开发人工智能相关硬件和软件的热潮。

通用 AI 和 GenAI 推动力开始增强的一个领域是 AI 服务器。分析公司 IDC 将 AI 服务器定义为运行专用于 AI 应用程序开发的软件平台、主要用于执行 AI 模型的应用程序和/或具有某些 AI 功能的传统应用程序的服务器。

我们是否需要AI服务器?推动人工智能繁荣发展的AI服务器

IDC 在 5 月份估计,到 2023 年,AI 服务器将占整个市场的 23% 左右,这一份额未来还将继续增长。IDC 还预测,到 2027 年,AI 服务器收入将达到 491 亿美元,前提是 GPU 加速服务器收入的增长速度将快于其他加速器的收入。

据供应商和销售商称,人工智能服务器和通用服务器之间的区别并不总是那么明显。

联想全球人工智能业务总监罗伯特戴格尔 (Robert Daigle) 表示,很多人在谈论人工智能服务器时,尤其是随着 GenAI 的蓬勃发展,都提到了富含 GPU 的系统,尤其是通常为训练和微调模型而设计的系统。

“[但] 还有很多用于 AI 工作负载的通用服务器,”Daigle 告诉我们。“当你脱离生成式 AI,甚至脱离深度学习,进入传统机器学习时,许多机器学习工作负载仍然在 CPU 上运行。”

Nor-Tech 是明尼苏达州伯恩斯维尔的一家定制系统构建商,也是 Nvidia 的顶级渠道合作伙伴,该公司既构建 AI 服务器,也销售其他制造商的模型。该公司工程副总裁 Dominic Daninger 告诉我们,AI 服务器基本上有两种类型,一种旨在进行训练,另一种在训练完成后旨在进行推理。

Daninger 表示,AI 服务器并不一定需要 GPU 来运行,但它们的性能比 CPU 好得多。

同时,他表示,还要注意的是,并非每台配备 GPU 的服务器都是以 AI 为重点的。诸如模拟模型或液体流动动力学之类的工作负载是使用 GPU 完成的,而不是 AI。

是否需要AI服务器?

加州圣何塞 Supermicro 高级副总裁 Michael McNerney 表示,人工智能服务器和非人工智能服务器之间的界限可能很微妙,取决于工作量。

McNerney表示:“我认为我们有八个不同的主要部分,从 LLM 大规模训练一直到边缘推理服务器,这些服务器将安装在工厂车间的杆式或壁式盒子上。”“我们确实看到人工智能几乎成为系统的一种功能,特别是当你深入到边缘时,这些盒子会根据其配置用于不同的事情。每台服务器在某个时候都可以成为 API 服务器,具体取决于它运行的工作负载类型。”

McNerney 表示,AI 是基于 GPU 的服务器上的主要工作负载,特别是那些通常用于 LLM 或大规模推理的最高配置的服务器,而中端机架式配置可以处理大多数推理工作负载。

Daigle 表示,联想拥有约 80 个经过认证的 AI 就绪服务器平台,可用于 GenAI 和广泛的 AI 领域。

“我们已经采取了一些措施,比如增加这些产品线对 GPU 和加速器的支持,并在它们上运行 MLPerf 等基准测试,以便客户能够看到这些系统的性能,以及我们如何提高性能并增强 AI 工作负载,”他说。“然后是我们在它们上运行的软件堆栈。我们的独立软件供应商生态系统中有 60 多家 AI 公司。这使我们能够实现 165 多种企业级 AI 解决方案。”

戴格尔表示,展望未来,人工智能服务器和通用服务器之间将继续存在界限。

“除了添加支持 AI 的基础设施外,客户还需要在其 IT 环境中支持大量传统工作负载,”他说。“因此,我认为除了扩展到 AI 之外,我们还将继续看到为这些传统 IT 工作负载设计的系统。”

展望未来,丹宁格表示,他预计英特尔和 AMD 将投资于以人工智能为重点的技术,但很难赶上英伟达。

“我们了解到的一件事是,Nvidia 在 CUDA 和真正实现 AI 所需的各种库上投入了大量精力,”他说。“此外,Nvidia 在硬件方面取得了巨大进步。英特尔或 AMD 等公司必须迅速采取行动才能在硬件方面击败 Nvidia,但另一个阻碍是开发所有代码以利用这些东西需要很多年。Nvidia 在这方面遥遥领先。”

McNerney表示,随着AI工作负载的增加,AI服务器集群变得非常重要,这将导致液体冷却的使用增加。

他说道:“我们认为,由于效率、性能和成本节省,在大规模集群空间中,使用液体冷却的部署比例将从不到 1% 上升至 30%。”

下来来看看来自多家服务器供应商和系统构建商的AI服务器样本。

联想 ThinkSystem SR780a V3

ThinkSystem SR780a V3 搭载 8 个 Nvidia H100/H200/B200 Tensor Core GPU,搭配两个第五代英特尔至强可扩展处理器和 32 个 DDR5 DIMM。Nvidia GPU 通过高速 NVLink 互连。该服务器包括联想 Neptune 液冷系统,该公司表示该系统比传统空气冷却更有效地散热,并允许 GPU 和 CPU 长时间以加速模式运行。ThinkSystem SR780a V3 可装入 5U 机箱中。

戴尔 PowerEdge R760xa

Dell PowerEdge R760xa 是一款专用服务器,采用双插槽、2U 风冷外形,支持各种 GPU。它以两个第四代或第五代英特尔至强处理器为中心,每个处理器最多有 64 个内核,并采用片上创新技术来增强 AI 和 ML 操作。该服务器最多有四个双宽 PCIe Gen5 加速器或最多 12 个单宽 PCIe 加速器,并支持 NVIDIA、AMD 和 Intel 的 PCIe GPU 适配器。该服务器提供最多 32 个 DDR5 内存 DIMM 插槽、Gen4 NVLink、PCIe Gen 5 和 E3.S NVMe SSD。

我们是否需要AI服务器?推动人工智能繁荣发展的AI服务器

超微 AS-4125GS-TNHR2-LCC

Supermicro 的 AS-4125GS-TNHR2-LCC 配备双插槽 AMD EPYC 9004 系列处理器和八个 Nvidia H100 GPU,通过 Nvidia NVLink 连接,体积紧凑,为 4U。该服务器面向 AI、深度学习和 HPC 应用,配备八个 PCIe 5.0 插槽和 24 个 DIMM 插槽,最多可容纳 6 TB 的 4800 ECC DDR5 内存。液冷可提高性能。

Nor-Tech 通用 GPU 服务器

Nor-Tech 的通用 GPU 服务器提供多架构灵活性和面向未来的开放标准设计,以提供先进且灵活的 GPU 服务器平台。服务器的模块化、基于标准的平台支持多种外形和组合的多种 GPU 技术,可用于大规模 AI 深度学习和 HPC 工作负载。这些 4U 服务器包括双第三代 Intel Xeon 可扩展或 AMD EPYC 7003 系列处理器、一系列行业标准 GPU 外形以及最多 10 个 2.5 英寸 NVMe/SATA 驱动器。可选的 1U 扩展模块可为高达 700 瓦的 GPU 和两个额外的 AIOM/PCIe 插槽提供更高的热容量。

HPE ProLiant DL385 Gen11 服务器

HPE ProLiant DL385 是一款 2U 双插槽服务器,配备第四代 AMD EPYC 9004 系列处理器和高达 6 TB 的 DDR5 内存和 36 个 EDSFF E3.5 NVMe SSD。这些服务器还可以容纳多达四个双宽或八个单宽 Nvidia L4、L40 或 L40S GPU。管理由 HPE GreenLake 提供,用于计算运营管理。

文章来源:我们是否需要AI服务器?推动人工智能繁荣发展的AI服务器-国外VPS网站

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/735523.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

(2024.6.23)最新版MAVEN的安装和配置教程(超详细)

1.什么是MAVEN Maven是一个自动化构建工具,主要用于Java项目,它由Apache软件基金会维护。Maven能够自动化完成编译、测试、打包、发布等构建过程,可以大大提高开发效率,保证项目的质量。 下面我们从几个方面来介绍一下MAVEN的功能…

字节跳动:从梦想之芽到参天大树

字节跳动掌舵人:张一鸣 2012年:梦想的起点:在一个阳光明媚的早晨,北京的一座普通公寓里,一位名叫张一鸣的年轻人坐在电脑前,眼中闪烁着坚定的光芒。他的心中有一个梦想——通过技术改变世界,让…

PHP米表域名出售管理源码带后台

源码介绍 html5米表源码PHP域名销售程序安装方法: 本站已测试,各项功能正常,功能易用,不复杂,非常适合个人米表使用 1、所有文件传至网站目录 2、浏览器执行http://你的访问网址/install 3、输入mysql帐号及密码信息,提交安装 源码截图 源码下载 …

【2024最新版】Java JDK安装配置全攻略:图文详解

目录 1. 引言2. 准备工作2.1 **确定操作系统**2.2 **检查系统要求**2.3 **下载JDK安装包**3. 安装步骤(以Windows系统为例)4. 配置环境变量4.1 jdk配置验证4.2 **配置JAVA_HOME环境变量**4.3 **配置Path环境变量**4.4 验证jdk是否配置成功 5. 结语 1. 引…

轻松重命名Windows用户Users目录下的文件夹名称

设置系统还原点 为避免设置失败,需提前准备好系统还原点以备份恢复系统。 打开系统属性: 在“系统保护”选项卡中,选择你想要保护的系统驱动器(通常是C:驱动器)。 点击“配置”按钮。 在弹出的窗口中,选…

opencascade AIS_InteractiveContext源码学习1 object display management 对象显示管理

AIS_InteractiveContext 前言 交互上下文(Interactive Context)允许您在一个或多个视图器中管理交互对象的图形行为和选择。类方法使这一操作非常透明。需要记住的是,对于已经被交互上下文识别的交互对象,必须使用上下文方法进行…

20240623 每日AI必读资讯

🤖原生鸿蒙AI浓度要爆表了! - 一年一度华为开发者大会上,余承东首次揭秘“鸿蒙原生智能”Harmony Intelligence! - 华为小艺进化成系统级智能体。 - 一句话实现跨多个应用的规划和任务执行;在第三方APP上随意处理文…

NSIS 入门教程 (三)

引言 在教程的第二部分中,我们为安装程序增加了一个卸载程序,并查看了一些其他的向导页面以及安装部分的选择。第三部分的目标是使安装程序的外观更加现代化。 更现代的外观 为了给安装程序一个更现代的外观,我们要启用现代用户界面。要提…

java基于ssm+jsp 社区疫情防控管理信息系统

1前台首页功能模块 社区疫情防控管理信息系统,在社区疫情防控管理信息系统可以查看首页、物品信息、论坛信息、新闻资讯、我的、跳转到后台等内容,如图1所示。 图1系统首页界面图 用户登录、用户注册,通过注册填写账号、密码、姓名、身份证、…

supOS浅度集成

一、浅度集成介绍 浅度集成是根据项目或者演示要求而做的集成工作,通过接入supOS的单点登录,UI调整,菜单栏的集成,从而达到客户使用supOS平台来使用各个应用的能力。 二、浅度集成的作用 通过较少的研发投入使APP应用浅度融入到…

密码学-密码协议之零知识证明

一、前言 零知识证明实际上一种密码协议,该协议的一方称为证明者(Prover),通常用P表示,协议的另一方是验证者(Verifier),一般用V表示。零知识证明是指P试图使V相信某个论断是正确的,但却不向V提供任何有用的信息&…

随记:内卷是什么意思?

内卷,网络流行语,原指一类文化模式达到了某种最终的形态以后,既没有办法稳定下来,也没有办法转变为新的形态,而只能不断地在内部变得更加复杂的现象。经网络流传,很多高等学校学生用其来指代非理性的内部竞…

UsersGUI.java用户界面

完成效果图: 点击阅读按钮: 点击删除按钮: 点击新建按钮: Code /* This GUI application allows users to manage their diaries: ​ Read: Users can read existing diaries. Create: Users can create new diaries. Delete: Us…

2024 年值得推荐的 10 款 iPhone 数据恢复软件

iPhone 从来都不是一个简单的打电话电话。它就像一台微型电脑,让我们互相联系、拍照、拍视频、发邮件、看文档、看书。然而,随着它成为日常生活的必需品,我们总是容易因各种原因丢失数据,如删除、恢复出厂设置、iOS 错误、文件同步…

基于Vue3.0 Node.js 的 大文件切片上传、秒传、断点续传实现方案梳理

✨💻 在处理大文件上传时,切片上传是提高效率与用户体验的关键技术之一。下面将详细介绍如何在前端利用Vue框架与Node.js后端配合,实现这一功能。 👆🏻大体流程 👆🏻一、文件切片上传 通过文件…

HTML静态网页成品作业(HTML+CSS)——故宫介绍网页(4个页面)

🎉不定期分享源码,关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 🏷️本套采用HTMLCSS,未使用Javacsript代码,共有4个页面。 二、作品演示 三、代…

ubuntu 22.04下利用webmin 搭建一个Wordpress 网站(2)

上次我们讲到第二部分,今天我们继续这一个话题 第三部分:利用webmin创建一个wordpress网站 1、在 Webmin 内安裝Apache 未使用的模块> Apache Webserver > 现在安装 会出现如下图所示的有关软件 刷新模快后 检查开机时要自动启动Apache 测…

TI毫米波雷达可以用串口调试助理来获取原始数据吗?

摘要:本文介绍一下如何使用普通的串口调试助理来读取到AWR1843毫米波雷达的数据的。 使用的硬件如下图所示。 软件就是普通的串口助理,我用的是SSCOM,其他串口助理也是可以的,核心作用其实就是发送一行行的指令而已。 操作方法&am…

HTML(18)——浮动

标准流 标准流也叫文档流,指的是标签在页面中默认的排布规则,例如:块元素独占一行,行内元素可以一行显示多个 浮动 作用:让块级元素水平排列 属性名:float 属性值 left:左对齐right&#…