大数据需要一场硬件革命

光子盒研究院

计算领域的进步往往集中在软件上:华丽的应用程序和软件可以跟踪人和生态系统的健康状况、分析大数据,并在智力竞赛中击败人类冠军。与此同时,对支撑所有这些创新的硬件进行全面改革的努力相对来说,略显小众。

自2020年以来,全球科技巨头谷歌、微软、IBM等纷纷扩大其人工智能(AI)的硬件研究;主要的芯片制造商们也正在采取行动,以在这一领域的竞赛中拔取头筹。当他们这样做的时候,意味着他们正盯着一个重大的转变——可以说是自计算诞生以来架构的第一次重大转变。

这对科学很重要:从天文学和粒子物理学到神经科学、基因组学和药物发现等领域的研究都希望使用人工智能来分析和寻找巨大的数据集;但是,这些却对传统计算机硬件提出了新的要求。

传统的冯·诺依曼架构将计算机内的数据存储单元与数据处理单元分开,这使得它们之间来回传递信息需要时间和能量,并在性能上造成瓶颈。

为了利用技术发展的优势,硬件工程师正在寻求建立超越冯·诺依曼设计限制的计算机:这将是向前迈出的一大步。几十年来,计算领域的进步一直是由缩小组件的尺寸驱动的,戈登·摩尔的预测是,芯片上的晶体管数量大约每两年翻一番——这通常意味着处理能力也会翻一番。

现代计算机与早期使用打孔卡(punch card)存储信息和使用机械式继电器进行计算的机器没有什么相似之处。现在的集成电路包含的晶体管非常小、超过1亿个晶体管可以装在针头上。然而,记忆和处理分离的基本设计仍然存在,这对它们可以实现的目标造成了限制。

一个解决方案可能是合并内存和处理单元,但在内存单元内执行计算任务是一个重大的技术挑战。

早在2018年,谷歌的AlphaGo研究就显示了一种可能的、不同的前进方式。该公司已经生产了名为张量处理单元的新硬件,其架构能够同时进行更多的操作。这种并行处理的方法大大提高了计算密集型计算的速度和能源效率,而放宽对执行精确和无误差计算的严格需求的设计(一种被称为近似计算的策略变化)可以进一步增加这些好处。

因此,像AlphaGo这样的人工智能程序的功耗已经大大改善。但是,提高这种硬件的能源效率对于人工智能的广泛普及至关重要。

人脑是最节能的处理器,所以硬件开发者自然会试图模仿它。被称为神经形态计算的方法旨在做到这一点,其技术可以模拟生物神经系统的通信和处理;现在,一些神经形态系统已经展示了在模式识别等任务上模拟神经元集合的能力。

目前,一场技术革命正在进行中,机器每年都在变得更加复杂。

超级计算机使用具有众多处理器的传统计算策略,快速处理大量数据以提供单一结果。这些计算机在原始计算速度方面是最强大的,但它们一次只能做一个任务,而且摩尔定律对它们能处理的数据量设置了上限(计算机处理器速度每两年翻一番的原则)。

另一方面,量子计算机利用量子力学定律,以普通计算机无法做到的方式处理信息,从而使处理速度大大增加。它们可以同时管理几个活动,并处理那些需要超级计算机几个月才能解决的挑战性问题。然而,由于它们对温度波动非常敏感、需要与外界影响隔离,量子计算机比传统的同类计算机需要更多的维护。

量子计算这一短语首次出现在英国物理学家David Deutsch 1985年写的一篇论文中,但这个想法可能早在1981年就已经起源了:当时已故的理查德·费曼提出了这个问题:在麻省理工学院的一次物理学和计算会议上,我们能在计算机上模拟物理学吗?

在公众和大众科学界,对量子计算机的真正性能存在着很多误解。在这之中的一个笨拙解释是,它们只是比超级计算机快,但这是不正确的。

尽管我们现在处于含噪声的中等规模量子计算(NISQ)时代,量子计算机和量子启发的算法也有可能对组合问题有帮助(如预测交通模式,以及对网络安全和密码学的关注)。

然而,要真正看到量子计算机脱离NISQ时代、走向“量子优势”,在药物设计、计算化学、金融建模和天气预报等垂直领域取得更好的结果,仍然将需要改进技术:这些包括但不限于系统内逻辑量子比特的数量、大幅减少退相干时间,以及增强纠错能力。

2021年,127量子比特的IBM量子计算机和Eagle处理器向公众揭开了面纱;Osprey是迄今为止最强大的量子计算机,它比谷歌和欧洲、亚洲各国创造的机器大一倍多。

历代IBM量子处理器的相对尺寸。

到2022年5月,Frontier超级计算机将能够进行每秒两万亿次的计算:开启了百亿亿级计算时代;彼时,根据IBM研究院的数据,IBM的127量子比特的Eagle处理器在猎鹰r5处理器上每秒可以进行2400次电路层操作,在猎鹰r4和r5处理器上的量子量高达128。我们不能从中推断出什么,但这些数据意味着一个30量子比特的系统可以每秒进行数万亿次的浮点运算

现在,IBM已经成功证明了Eagle R3 处理器在二维横向场伊辛模型的时间演化问题上,击败了超级计算机;不过,这并不是说今天的量子计算机超过了经典计算机的能力。从2022年起,超级计算机仍然有着明显的计算优势——至少对于任何有商业价值的东西来说。

那么,在量子计算机与超级计算机的比较中,我们应该使用什么计算机呢?

尽管它们都有可能改变计算技术,但它们的速度和能力差别很大。现在,更多机构/组织的思考并非聚焦在量子计算机与超级计算机的较量中谁会获胜,而是这两者如何结合、形成一个单一的最高计算单元。

众多机构与组织已经介入,试图鼓励这种硬件的发展与融合。例如,欧洲正建立HPC-量子资源联盟:EuroHPC JU指定了6个量子计算“托管”站点:IT4I-捷克、GENCI-CEA-法国、LRZ-德国、CINECA-意大利、PSNC-波兰和BSC-CNS-西班牙。不同的中心正在探索不同的量子比特模态(光子、中性原子、超导等),并致力于将量子设备带入传统HPC环境中。

6月4日,上海超级计算中心与合肥知名量子初创企业合作,成立了长三角“量超协同”创新中心。该中心成立是国内首个“量超协同”计算基地,承担着试点量子、经典计算设施协同运行的重要使命。

超级计算机无法与量子计算机的速度和功率相比。因为它们可以同时处理几个计算,所以它们非常适合处理需要有效处理大量数据的挑战性问题;超级计算机可以处理更多种类的工作,但它们一次只能处理一个。

但是,当我们明确对比它们时,量子计算机可以被称为超级计算机的一个“子集”,这就成为一个语义上的争论。与超级计算机类似,量子计算机预计将在单一活动中表现出色,而不是取代传统的台式电脑和笔记本电脑

——它们可能还需要大量的维护和适当监管的数据中心。

完全有可能的是,在未来,我们甚至无法再区分量子计算机和超级计算机:我们可能会简单地把这个市场称为“超级计算或混合环境下的高性能计算”,在这个环境中,我们结合CPU、GPU和QPU来解决极其复杂问题的各个部分

微软近日发布的量子超级计算机战略或许应证了这一猜想,不过,超级计算机和量子计算机之间冲突的最终结果只有随着时间的推移才会知道。

随着相关科技研究发展,从早期的电子数字计算机到今天复杂的 HPC 系统,高性能计算的突破一直以不断创新和对更高性能的不懈追求为标志。毫无疑问的是,我们正不断突破算力可能性界限,相关技术将在塑造我们对世界的理解和推进人类知识发展方面发挥越来越重要的作用。

现在,我们期待着更多报道进展和发表成果。许多领域的科学家们也都在等待结果:强大的计算机足以筛选他们所有新发现的数据——或许他们将不得不等待一段时间,但这种等待应该是值得的。

展望未来,计算硬件的持续发展有望释放新的可能性并推动各个领域的创新。

参考链接:

[1]https://www.nature.com/articles/d41586-018-01683-1

[2]https://www.analyticsinsight.net/quantum-computers-vs-supercomputers-what-is-the-difference/

[3]https://mp.weixin.qq.com/s/Pf_I3dN9-HyT-QJ30kL9-Q

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/32968.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Scala里的WordCount 案例

7.7.5 普通 WordCount 案例 package chapter07object TestWordCount__简单版 {def main(args: Array[String]): Unit {//单词计数:将集合中出现的相同单词计数,进行计数,取计数排名的前三的结果val stringList List("Hello Scala Hbas…

【数据可视化方案分享】电商数据分析

本文所分享的电商数据分析报表均来自奥威BI软件的电商数据分析方案!该方案是一套包含数据采集、数据建模、数据分析报表的系统化、标准化数据分析方案,下载套用,立见效果! 注意,奥威BI软件的电商数据分析方案分两类&a…

【基于Django框架的在线教育平台开发-01】账号登录及退出登录功能开发

文章目录 1 模型层开发2 视图层开发3 form表单验证4 配置urls.py5 模板层开发6 效果展示 1 模型层开发 用户数据表如下所示: FieldTypeExtraidintPrime Key & Auto Incrementpasswordvarchar(128)last_logindatetime(6)Allow Nullis_superusertinyint(1)usern…

mysql 常见锁类型

表锁 & 行锁 在 MySQL 中锁的种类有很多,但是最基本的还是表锁和行锁:表锁指的是对一整张表加锁,一般是 DDL 处理时使用,也可以自己在 SQL 中指定;而行锁指的是锁定某一行数据或某几行,或行和行之间的…

第二章 数据处理篇:transforms

教程参考: https://pytorch.org/tutorials/ https://github.com/TingsongYu/PyTorch_Tutorial https://github.com/yunjey/pytorch-tutorial 详细的transform的使用样例可以参考:ILLUSTRATION OF TRANSFORMS 文章目录 为什么要使用transformstransforms方…

二叉树题目:单值二叉树

文章目录 题目标题和出处难度题目描述要求示例数据范围 解法一思路和算法代码复杂度分析 解法二思路和算法代码复杂度分析 题目 标题和出处 标题:单值二叉树 出处:965. 单值二叉树 难度 3 级 题目描述 要求 如果二叉树每个结点都具有相同的值&am…

SQL死锁

目录 前言: 分析: 死锁产生的原因: sql死锁 模拟: 解决办法: (本质:快速筛选或高效处理、以此减少锁冲突) ①大事务拆成小事务,尽可能缩小事务范围 大事务:将多个操作放在一个事务中执行…

【MOOC 测验】第5章 链路层

1、局域网的协议结构一般不包括( ) A. 数据链路层B. 网络层C. 物理层D. 介质访问控制层 逻辑链路控制子层、介质访问控制子层、物理层 2、下列关于二维奇偶校验的说法,正确的是( ) A. 可以检测和纠正双比特差错B…

【CVRP测评篇】 算法性能如何?来测!

我跨越了2100015秒的距离,为你送上更全面的算法性能评测。 目录 往期优质资源1 CVRP数据集2 实验准备2.1 计算机配置2.2 调参方法2.3 参数设定2.4 实验方法 3 实验结果3.1 最优解统计3.1.1各数据集上的算法性能对比3.1.2 求解结果汇总3.1.3小结一下3.1.4 还有话说 3…

【软考网络管理员】2023年软考网管初级常见知识考点(10)- 网际协议IP及IPV6,IPV4详解

涉及知识点 分类的IP地址,子网划分,CIDR和路由汇聚,IPV4数据报格式,IPV6协议,软考网络管理员常考知识点,软考网络管理员网络安全,网络管理员考点汇总。 原创于:CSDN博主-《拄杖盲学…

剑指 Offer 68 - II. 二叉树的最近公共祖先 / LeetCode 236. 二叉树的最近公共祖先(搜索与回溯)

题目: 链接:剑指 Offer 68 - II. 二叉树的最近公共祖先;LeetCode 236. 二叉树的最近公共祖先 难度:中等 上一题博客:剑指 Offer 68 - I. 二叉搜索树的最近公共祖先 / LeetCode 235. 二叉搜索树的最近公共祖先&#xf…

SSH远程直连Docker容器

文章目录 1. 下载docker镜像2. 安装ssh服务3. 本地局域网测试4. 安装cpolar5. 配置公网访问地址6. SSH公网远程连接测试7.固定连接公网地址8. SSH固定地址连接测试8. SSH固定地址连接测试 转载自cpolar极点云文章:SSH远程直连Docker容器 在某些特殊需求下,我们想ssh…

机器学习李宏毅学习笔记34

文章目录 前言一、Knowledge distillation二、Parameter quantization三、Architecture design四、Dynamic computation总结 前言 神经网络压缩(二)其他方法 一、Knowledge distillation 先train一个大的network叫做teacher network,小的ne…

Vue3:计算属性、监听器

computed 计算属性 计算属性是指 基于现有状态派生 (演变) 出新的状态,现有状态发生变化,派生状态重新计算。 computed 接收回调函数作为参数,基于回调函数中使用的响应式数据进行计算属性的创建,回调函数的返回值就是基于现有状态…

壳牌小程序笔记

壳牌加油站 uni-app-基础-day01 概览 为什么要学uni-app? 现在很多中小型公司,都有自己的小程序项目,然后开发小程序就会用到uni-app。 uni-app没有诞生之前,怎么写小程序 使用原生微信小程序这个框架去开发? 只…

解析vcruntime140.dll文件,缺失了要怎么去修复?

在计算机的世界中,vcruntime140.dll是一个重要的动态链接库文件。然而,有时候这个文件可能会引发一系列问题,影响应用程序的正常运行。如果你缺少了vcruntime140.dll,那么你的程序就会打不开,今天我们一起来聊聊vcrunt…

鸟类识别Python,基于TensorFlow卷积神经网络【实战项目】

一、介绍 鸟类识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Django框架,开发网页端操作平台,…

Linux Ubuntu man文档的图文安装教程

文章目录 前言man文档的起源man文档的安装man文档的使用总结 前言 当提及"man文档"时,通常是指Unix和类Unix系统中的手册页(man page),因为Linux是在Unix的基础上发展而来的操作系统,所以我们的Linux也有ma…

IIS安装localhost显示下载,urlrewrite设置

1.取消ftp服务勾选 2. ping localhost ping 127.0.0.1 如果显示 ::1 则需要禁用ipv6 在注册表 找到并单击下面的注册表子项: HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip6\Parameters\ 双击“DisabledComponents”以修…

【机器学习】sklearn数据集的使用,数据集的获取和划分

「作者主页」:士别三日wyx 「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」:对网络安全感兴趣的小伙伴可以关注专栏《网络安全入门到精通》 sklearn数据集 二、安装sklearn二、获取数据集三、…