近年来,在技术研发和产业应用的共同推动下,中国超级计算机(简称“超算”)快速发展——技术创新方面,采用自主研发芯片的多个国内超算曾在世界超算榜单上排名第一;整体规模方面,在最新发布的全球超算榜单中,中国占比超过1/3;应用创新方面,2016以来,多个创新应用获得全球高性能应用领域最高奖“戈登·贝尔”奖。
一直以来,超算作为国家在算力基础设施领域最为重要的高性能计算能力技术,在很大程度上体现了国家的综合科研实力。海量数据处理能力和高密度计算能力是衡量超算性能优劣的直观标准,业内通常采用算力(浮点运算速度)和算效(浮点运算速度每瓦特)对超算的绝对性能和能效进行评价。10年前,国际超算的绝对计算能力已达到P级,即每秒可进行千万亿次数学运算。
高性能计算机HPC,又称超级计算机)主要被用来解决其他计算机解决不了的挑战性问题,通常指具有极快运算速 度、极大存储容量、极高通信带宽的一类计算机。超级计算被视为计算机科学与工程的“皇冠”,各国近年来均频繁从国家层面启动研制计划。
超级计算机可以对所研究的对象进行数值模拟和动态显示, 从而获得实验很难甚至无法得到的结果。例如, 可应用在预测气候变化, 预报恶劣天气, 理解基因功能, 以及模拟核爆炸过程, 甚至模拟宇宙演化过程等领域中。超级计算机的发展使得计算科学成为人类认识和改造世界的新的方法和途径。
超级计算是计算机科学与工程的“皇冠”。超级计算是计算机技术的源头之一。互联网产业依赖的数据中心的核心技术,诸如 Hadoop等并行编程工具和 RDMA 等远程通信技术大多脱胎于此。因此,超级计算机被视为计算机科学与工程的“皇冠”。
不断发展的超算技术,可以支撑重大科学领域的技术研究,也可推动新兴科技领域的应用创新,发挥着引领国家科技进步的关键作用。多年来,超算技术广泛应用于航天航空、电磁计算、海洋模式、医学影像、材料基因等重大科学研究和国计民生领域,为国家的基础科学研究和相关领域的技术攻关作出重要贡献。随着更多的现实应用从基于数据的模拟与仿真,走向基于算法的挖掘和训练,大数据、人工智能等新兴技术正在与超算技术融合。超算逐渐成为支撑信息化发展的算力基础设施和城市及重点行业的算力大脑。
经过几十年的发展,我国超算取得了一定的成绩,但仍面临着不小挑战。一是技术异构带来的适配问题逐渐显现。不同的芯片架构确保了超算的实施路径冗余,但随着各类应用的深入发展,也带来了软件适配的难题。模型、算法和芯片之间需要做二次适配,导致应用软件移植很难实现。二是智算中心带来的冲击日渐剧烈。
2020 年以来,十四五和新基建驱动我国超级计算中心建设进入高速增长期,多地地方政府和企事业单位都在积极建设和筹建超级计算中心。
在中国多次上榜全球超级计算TOP500 后,美国自 2015 年起将多所中国超级计算相关机构或企业列入实体清单,包括国防科大、无锡江南计算技术研究所、曙光、申威等。而我国超级计算整体实力和美国相比仍然有较大差距。
从 2021 年 11 月中国超级计算机 TOP100 中的行业应用领域 Linpack 性能份额来看,算力服务、超级计算中心、人工智能、科学计算等领域是超级计算的主要用户,互联网大数据特别是 AI 领域增长强劲。
十四五和新基建驱动超级计算进入快速增长期。我国高性能计算中心建设主要通过部省(市)合作协议确立超级计算中心的建设计划,国家科技部代表国家科技战略对主机性能设定目标。地方政府希望超级计算中心能成为区域科技发展的功能载体,为其聚集人才、创新科技并推动经济发展。
2021 年 3 月,我国“十四五规划”中明确提出,要“加快构建全国一体化大数据中心体系AZ,强化算力统筹智能调度,建设若干国家枢纽节点和大数据中心集群,建设 E 级和 10E 级超级计算中心。”根据规划,合肥、兰 州、厦门、太原等地多地都将陆续建立超级计算中心。
近年来,美国、欧盟、日本等国家和地区正加速推动E级(每秒可进行百亿亿次数学运算)计算性能目标的实现和优化。中国也高度重视E级超算的开发和研究,并已经研制成功多台E级原型机。与国外相比,中国超算的特点和优势主要体现在计算性能、自主研发和绿色节能等方面。
随着人工智能需求的兴起,2019年至今,全国建设了20多个智算中心,对超算的发展带来较大冲击。超算和智算中心如何实现差异化发展,是行业面临的重要问题。三是商业模式带来的挑战渐成现实。国家对超算的扶持性政策弱化之后,超算中心如何走出一条自负盈亏、甚至略有盈余的可持续发展道路,是摆在运营者面前的现实问题。