算效最高的智算中心上线,天府智算为AI产业带来哪些启示?

四川简阳,地处川中、控扼巴峡,自古乃成渝、川鄂之间的交通重镇,素有“天府雄州”之美誉。

步入数字经济时代,“天府雄州”得天独厚的地理位置再次彰显出巨大的战略价值。简阳市成为成渝算力枢纽的天府数据中心集群关键布局点,对今后支撑四川数字经济和成都AI产业高质量发展有着举足轻重的意义。

近日,位于简阳市的天府智算西南智算中心正式上线,标志着成渝算力枢纽完成阶段性建设。同时,天府智算西南智算中心一跃成为当前国内算力效率(MFU)最高的算力中心,不仅代表着智算中心未来建设方向,也为AI产业高质量发展注入新动能。

AI产业高质量发展离不开算效比

四川被誉为“天府之国”,拥有完备的产业体系和深厚的教育资源。2023年,四川的经济总量已经跃居全国第五。从过去向经济要体量,到现在体量与质量并举,四川已明确发展新质生产力和经济高质量发展的核心思路:即加快做优做强人工智能产业,利用AI等数字化技术全方位、深层次赋能传统产业。

以成都市为例,成都市近年来集聚起一批人工智能企业、科研机构和创新平台,初步形成基础层、技术层、应用层全产业链覆盖的发展格局。最新《成都市人工智能产业高质量发展三年行动计划(2024—2026年)》更提出,到2026年,成都人工智能核心产业规模达到1700亿元,带动相关产业规模达到1万亿元,建成全国人工智能产业发展高地。

可以预见,随着四川经济全面向高质量发展转型,以及人工智能产业的持续发展,未来将产生大量且持续的算力需求,高质量的AI算力更是不能缺位。能投天府云执行董事兼总经理任国斌直言,与四川地区经济体量和AI产业发展需求相比,数据中心等算力基础设施正处于一个追平补短的快速发展阶段。

此时,建设高水平的智算中心就成为大势所趋。除了智算中心规模之外,算力效率(MFU)的重要性也日趋突出,以平衡未来算力与需求之间的供需关系。事实上,天府智算西南智算中心的上线,无疑是成渝算力枢纽在高水平智算中心的一次成功实践。

众所周知,人工智能产业高质量的发展,离不开生成式AI应用的爆发与普及。而生成式AI则需要基于海量的自然语言或多模态数据集,对拥有巨大参数的AI大模型进行持续训练,往往需要千卡甚至万卡的AI集群来支撑,所需AI算力当量远胜过往应用。

因此,超大规模的AI集群的训练算力效率(MFU)将直接影响到模型训练时长、成本乃至效果,更对于生成式AI研发创新、AI产业高质量发展有着潜移默化般的影响。毫无疑问,天府智算西南算力中心为算力效率(MFU)的提升打了个样儿。

据悉,天府智算西南算力中心为提升算力效率(MFU),与浪潮信息AI团队紧密配合,对算力系统进行专业设计,对集群架构、高速互联、算力调度等方面全面优化,并结合浪潮信息源大模型的训练优化经验,对分布式训练策略进行针对性优化,通过合理设计张量并行、流水并行和数据并行,精准调整模型结构和训练过程的超参数,最终实现千亿参数规模AI大模型的训练算力效率(MFU)提升至80%,刷新业界AI大模型训练算力效率(MFU)新高。

除了在算力效率(MFU)方面出类拔萃之外,天府智算西南算力中心还在数据中心能效层面进行了大胆创新和突破,以42kW智算风冷算力仓为创新切入点,完美解决数据中心高密部署、高效散热和机房维护改造等一系列挑战。

智算风冷算力仓:迎接高密化趋势

高密化是所有智算中心未来发展的确定性趋势。

由于人工智能产业的快速发展,对于数据中心算力、散热、运维乃至建设模式都提出全新要求,使得数据中心不可避免的走向高密化。高密化对于数据中心有着两个关键性影响:其一、可以大规模部署高密机柜,实现单位面积算力产能的提升;其二、会直接推动数据中心能效比提升以及先进节能技术落地,以满足数据中心绿色低碳的要求。

以四川地区为例,大量的AI服务器在智算中心部署,使得单机柜功率与功耗不断攀升,数据中心需要解决固定空间内高密化部署的高效散热挑战;其次,四川省已经颁布数据中心PUE政策,集群起步区内新建数据中心PUE不高于1.25,传统数据中心节能技术不能满足需求;第三,数据中心的建设模式与机房等环境需要匹配智算中心和未来算力服务的建设需求。

为此,能投天府云与浪潮信息进行联合创新,成功研发出42kW智算风冷算力仓,并且在天府智算西南算力中心得到大规模部署。浪潮信息服务器产品线总经理赵帅介绍,“42kW智算风冷算力仓本质上就是超高密化的模块化数据中心。”

42kW智算风冷算力仓以AI算力为核心,是为AI服务器量身定制的支持高算力密度部署的新一代智算基础设施,集计算/存储/网络于一体,高效融合机柜、配电、UPS、空调、监控、消防等系统,基于标准化、去工程化、运行效率最优化、管理智能化等原则设计,具备快速交付-省时、高密部署-省地、高效节能-省电、安全智能-省心等核心优势。

当下,以天府智算西南算力中心为代表的智算中心,普遍需要快速应对人工智能产业对于算力的急迫需求。通过42kW智算风冷算力仓,数据中心只需预留场地、冷量和电力,一周即可完成部署,建设周期缩短70%。

42kW智算风冷算力仓的高密化部署将单机柜功率密度从3~7kW大幅提升到42kW,输出超高密度算力,实现单位面积算力产能的突破,减少建设用地60%。

难能可贵的是,42kW智算风冷算力仓通过风冷模式即实现了高效节能,融合中压到末端馈线的全功率简链路供电及高效UPS系统让电能损耗有效降低30%以上;冷热通道全密封+列间空调高温进水模式让制冷能效比提升10%以上,大幅降低PUE,相比传统风冷数据中心整体节能25%以上。

此外,42kW智算风冷算力仓还充分融合了AI能力,利用AI管理平台实现数据中心统一纳管,结合AI智能调优算法,实现数据中心级及服务器级双向故障预警,做到数据中心真正的AI化监控、管理、运维,安全可靠性提升30%。

“现在的智算中心,单纯依靠AI服务器已经远远不够,需要通过高水平的数据中心来综合支撑AI服务器的部署与应用。在天府智算西南算力中心,浪潮信息与能投天府云很好地分析了业务需求,在一期采用了42kW智算风冷算力仓解决方案,快速上线满足了当前AI产业的算力需求。”赵帅补充道。

为“智算中心”建设打个样儿

IDC《全球人工智能支出指南报告》预测,到2027年,中国AI投资规模有望达到381亿美元,在政策扶持和产业转型升级的驱动下,以智算中心为代表的先进基础设施在未来五年将成为市场投资的重要方向。

随着各地对于经济高质量和新质生产力发展的需求,建设高水平的智算中心将是未来整个社会、产业的共同目标。而天府智算西南智算中心从规划、设计到上线,无疑为智算中心未来的建设打了个样儿。

首先,天府智算西南算力中心做到规划先进、贴近需求,针对成都市AI产业高质量发展的算力需求,从先进的规划设计到快速上线,实现了规划与需求的高度契合。目前,天府智算西南算力中心已经为高校研究所、科技型企业提供算力服务,广泛支撑起大数据、深度学习、智能语音语义、生物医学等领域的需求。

其次,天府智算西南算力中心是产业合作与创新的典型。智算中心是数据中心在AI时代的一次重塑,涉及到算力、环境、建设模式等方方面面。浪潮信息与能投天府云紧密合作,共同打造出创新的42kW智算风冷算力仓解决方案,将AI大模型训练算效比提升到80%。

第三,未来有望对外输出、惠及产业。面对未来AI产业高质量发展的需求,42kW智算风冷算力仓解决方案不仅为天府智算西南算力中心带来实质性的突破,更有望为其他智算中心建设带来最佳借鉴方案和巨大的产业价值。

“42kW智算风冷算力仓在天府智算西南算力中心交付之后,实现了数据中心定制服务领域的重大突破,为四川人工智能产业发展提供强劲的动能。”赵帅最后表示道。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/798050.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

element ui ts table重置排序

#日常# 今天带的实习生&#xff0c;在遇到开发过程中&#xff0c;遇到了element ui table 每次查询的时候都需要重置排序方式&#xff0c;而且多个排序是由前端排序。 <el-table :data"tableData" ref"restTable"> </<el-table> <script…

bi项目笔记

1.bi是什么 bi项目就是商业智能系统&#xff0c;也就是数据可视画、报表可视化系统&#xff0c;如下图的就是bi项目了 2.技术栈

深入了解 MySQL 的 EXPLAIN 命令

一、什么是 EXPLAIN 命令&#xff1f; EXPLAIN 命令用于显示 MySQL 如何执行某个 SQL 语句&#xff0c;尤其是 SELECT 语句。通过 EXPLAIN 命令&#xff0c;可以看到查询在实际执行前的执行计划&#xff0c;这对于优化查询性能至关重要。 二、EXPLAIN 的基本用法 要使用 EXP…

什么时候要用弗洛伊德算法

分析一下题目&#xff0c;我们看到数据量只有一百&#xff0c;这个时候我们就要注意是否是要用弗洛伊德算法&#xff0c;然后接着我们还需要枚举每一种情况&#xff0c;我们可以用到next_permutation这个方法 #include<bits/stdc.h> using namespace std;const int N 10…

matlab R2016b安装cplex12.6,测试时cplex出现出现内部错误的解决方法

问题场景 网上搜索matlabyalmipcplex的安装教程&#xff0c;跟着步骤操作即可&#xff0c;假如都安装好了&#xff0c;在matlab中测试安装是否成功&#xff0c;出现以下问题&#xff1a; 1、matlab中设置路径中添加了yalmip和cplex路径&#xff0c;在命令窗口中输入yalmiptest…

实现将Nginx的每个网站配置单独的nginx配置文件——每个网站单独管理

一、问题描述 Nginx默认地配置文件【nginx.conf】是包含了所有网站的配置内容,如果我们需要配置很多网站的话,就需要在默认的配置文件中给每个网站都添加一条server记录,这样下去nginx默认配置文件会变得很大,很难管理(比如有些网站不使用了,需要注销掉,也需要到该文件操…

openEuler 安装 podman 和 podman compose

在 openEuler 22.03 LTS SP4 中&#xff0c;你可以使用 dnf 包管理器来安装 Podman 和 Podman Compose。openEuler 默认使用 dnf 作为包管理器&#xff0c;所以这是安装软件的首选方式。 关于 openEuler 22.03 LTS SP4 下载地址&#xff1a; https://www.openeuler.org/zh/dow…

【接口自动化_06课_Pytest+Excel+Allure完整框架集成】

一、logging在接口自动化里的应用 1、设置日志的配置&#xff0c;并收集日志文件 日志的设置需要在pytest.ini文件里设置。这个里面尽量不要有中文 2、debug日志的打印 pytest.ini文件的开关一定得是true才能在控制台打印日志 import allure import pytest from P06_PytestFr…

Java中实现一维数组逆序交换的完整解决方案

引言 ❤❤点个关注吧~~编程梦想家&#xff08;大学生版&#xff09;-CSDN博客 在日常编程中&#xff0c;处理数组时经常会遇到需要逆序交换数组元素的情况。逆序交换即是将数组的第一个元素与最后一个元素交换&#xff0c;第二个元素与倒数第二个元素交换&#xff0c;依此类推…

HCIA学习笔记(6)-ACL+NAT

ACL&#xff1a;访问控制列表 访问控制-------在路由器的入或者出接口上&#xff0c;匹配流量&#xff0c;之后产生动作-----只有允许或拒绝 定义感兴趣流量------帮助其他策略去抓流量 匹配规则&#xff1a;至上而下&#xff0c;逐一匹配&#xff0c;上条匹配按照上条执行&…

JavaSE——集合框架二(4/6)-Map集合的遍历方式(键找值,键值对,Lambda)、Map集合案例(需求与分析,问题解决)

目录 Map集合的遍历方式 键找值 键值对 Lambda Map集合案例 需求与分析 问题解决 Map集合的遍历方式 键找值 先获取Map集合全部的键&#xff0c;再通过遍历键来找值。 键值对 把“键值对”看成一个整体进行遍历&#xff08;较为复杂&#xff09; Lambda JDK 1.8 开…

Cadence23学习笔记(二)

原理图设计界面中就可以直接新建PCB: 亲测&#xff1a;需要画完原理图&#xff0c;并且DRC通过之后才可以&#xff01; 放置完元器件之后要规定元件的Footprint &#xff0c;注意PCB封装名要和库文件中的名字对应&#xff1a; DRC按钮&#xff1a; 点击图标 N, 生成第一网表&…

MAVSDK动态库与静态库及mavsdk_server程序macOS平台编译与安装

1.克隆mavsdk: git clone https://github.com/mavlink/MAVSDK.git --recursive 2.编译静态库 cmake -Bbuild/default -H. -DCMAKE_BUILD_TYPE=Release -DBUILD_SHARED_LIBS=OFF 生成makefile 生成成功,开始编译 cmake --build build/default -j8 成功生成libmavsdk.a 开…

给老笔记本安装双系统,太难了(centos+win10)记录一下过程

为什么要装个centos呢&#xff1f; 大学时期的笔记本&#xff0c;一直在吃灰&#xff0c;开机都卡。于是想废物利用一下&#xff0c;做个linux服务器玩&#xff0c;但是也不想直接删除win10&#xff0c;于是就开始开始装双系统。工作中的服务器基本都是centos的&#xff0c;所…

笔记 2 :linux 0.11 中的重要的全局变量 (a)

通过对全局变量的了解&#xff0c;也有助于了解整个代码的逻辑。就跟学习类一样&#xff0c;了解类有哪些成员变量&#xff0c;也有助于了解类的成员函数的功能。 以下介绍全局变量的顺序&#xff0c;符合这两本书的讲解顺序&#xff1a; &#xff08;1&#xff09;内存初始化相…

Python 获取今天(当天)、昨天(前一天)、前天(昨天的前一天)的开始时间、结束时间

描述&#xff1a;我这里是封装成DatetimeHelper工具类来调用 1.今天(当天)开始时间、结束时间 from datetime import datetime, timedeltaclass DatetimeHelper:# 获取当前的开始时间、结束时间(datetime类型)staticmethoddef getTodayStartEnd():# 获取当前的日期now datet…

记一次TIDB开启TLS失败导致PD扩容失败案例

作者&#xff1a; Dora 原文来源&#xff1a; https://tidb.net/blog/8ee8f295 问题背景 集群之前由于TIUP目录被删除导致TLLS证书丢失&#xff0c;后续需要重新开启TLS 在测试环境测试TLS开启步骤&#xff0c;导致后续两台PD扩容失败&#xff0c;步骤如下&#xff1a; …

Animate软件基础:库面板

“库”面板&#xff08;“窗口”>“库”&#xff09;是存储和组织在 Animate 中创建的元件的位置。还可以存储导入的文件&#xff0c;包括位图图形、声音文件和视频剪辑。 “库”面板可以在文件夹中组织库项目。 此外&#xff0c;可查看项目在文档中的使用频率&#xff0c;按…

JAVA从入门到精通之入门初阶(二)

1. 自动类型转换 自动类型转换&#xff1a;类型范围小的变量可以赋值给类型范围大的变量 byte->int public class java_7_10 {public static void main(String[] args) {//自动类型转换//类型范围小的变量可以赋值给类型范围大的变量 byte->intbyte a 12;int b a;//自动…

微信小程序密码 显示隐藏 真机兼容问题

之前使用type来控制&#xff0c;发现不行&#xff0c;修改为password属性即可 <van-fieldright-icon"{{passwordType password? closed-eye:eye-o}}"model:value"{{ password }}"password"{{passwordType password ? true: false}}"borde…