存算一体化与边缘计算:重新定义智能计算的未来

5274626faba2fa48369e6da677f4bcf6.jpeg

随着数据量爆炸式增长和智能化应用的普及,计算与存储的高效整合逐渐成为科技行业关注的重点。数据存储和处理需求的快速增长推动了对计算架构的重新设计,“存算一体化”技术应运而生。同时,随着物联网、5G网络、人工智能(AI)等技术的发展,数据量的分布性、实时性需求增加,边缘计算也逐渐从概念走向落地。本文将介绍存算一体化与边缘计算的核心思想及其发展趋势,探讨两者在智能计算模式中的应用前景。


从“冯·诺依曼架构”说起:传统计算模式的困境

1a0fa0b42957d8c2f05c4da12611cb64.png

冯·诺依曼

上世纪40年代,著名数学家冯·诺依曼提出了一个开创性的计算架构,被称为“冯·诺依曼架构”。它提出了计算机系统的五大基本组成部分:输入单元、输出单元、存储单元、控制单元和运算单元,并定义了它们之间的交互方式。冯·诺依曼架构的核心思想是将计算和存储分离,数据和指令通过统一的总线在中央处理单元(CPU)和内存之间传输。该架构的经典特征为存储程序概念,即程序和数据同样存储在内存中,由CPU读取并执行。

6723261dbc9736453b91e87272b07650.png

尽管结构简单、通用性强,适用于多种计算任务,但在今天,它的局限性越来越明显。

40129bb250003f703cb9cda0ebabf45d.jpeg

1. 数据传输瓶颈:在冯·诺依曼架构中,数据频繁在内存和CPU之间搬运。这一过程带来显著的延迟,系统难以高效处理数据,尤其在大数据和AI模型的应用场景中表现尤为突出。
2. 高能耗:频繁的数据传输不仅增加了电力消耗,还带来了硬件的发热和散热成本,在能源要求越来越高的计算任务中成为一大限制。
3. 资源利用率低:CPU和内存之间常常互相等待,尤其在密集计算任务中,导致系统资源的利用效率低下。

这种“冯·诺依曼瓶颈”直接制约了当今的人工智能、大数据分析等计算任务的发展。

463e6c909f0e21b4c8fd250b4788aa13.jpeg

存算一体化和边缘计算 被视为解决这一瓶颈的有力方案。

a7f6d5af59f06d74f62c608d7499b022.gif


存算一体化:突破冯·诺依曼瓶颈的创新

存算一体化(Processing-In-Memory,PIM)打破了“存储-计算分离”的模式,直接在存储单元内部集成计算单元,实现了数据的“就地处理”。这一创新从根本上优化了计算结构,带来了巨大的性能提升。

f46f73da09d221e8412741a8e514c4fc.jpeg

存算一体化的三大优势:
  • 显著降低延迟:数据在存储器内直接处理,无需频繁搬运,大大减少了延迟。

  • 降低能耗:减少数据搬运所需的电力消耗,延长设备续航,提高系统能效。

  • 提升并行计算效率:特别适用于大规模并发计算任务,如深度学习和大数据分析。

根据计算单元与存储单元的距离,存算一体化主要分为三类:近存计算(PNM)、存内处理(PIM)和存内计算(CIM)。

1. 近存计算(PNM):近存计算是一种较为成熟的技术路径,采用先进的封装技术,将计算逻辑芯片和存储器封装在一起,缩短内存和处理单元之间的路径,以实现更高的I/O密度,带来高带宽和低访问开销。该方案主要依托2.5D、3D堆叠等技术,广泛应用于CPU和GPU等高性能处理器中,是实现存算一体化的首选方案之一。
2. 存内处理(PIM):存内处理旨在尽可能多地将计算过程嵌入到存储器内部,减少处理器对存储器的访问频率。通过在存储器中直接完成大部分计算任务,这一技术有效降低了数据搬运需求,有助于缓解冯·诺依曼瓶颈带来的限制。这种方案在内存密集型任务上具有显著的性能优势,被认为是未来智能计算的重要实现路径。
3. 存内计算(CIM):存内计算也称为国内一些公司推崇的“存算一体”。它通过对存储器结构进行改进,使其直接具备计算能力。存内计算有两种实现思路:
  • 电路革新:通过改动SRAM或MRAM等存储器,使其具备计算功能,这种方法能效比高,但计算精度可能受限。

  • 集成计算单元:在存储器(如DRAM)中集成额外计算单元,以支持高精度计算。然而,由于DRAM工艺对计算逻辑电路的适应性差,这一方式面临较大的工艺挑战。

不同公司在存算一体化领域有各自的技术策略。部分企业聚焦于优化存储与计算的协同效率,提升大数据处理的性能;另一些公司则注重架构的灵活性和可扩展性,以应对动态的市场需求。此外,存算一体化的存储介质也日趋多元,包括以SRAM、DRAM为代表的易失性存储器和以Flash为代表的非易失性存储器等。

bb6cd811e67f27136dbe944baaab7f47.png


边缘计算:让数据在源头处理的高效模式

边缘计算(Edge Computing)则是一种将数据处理资源部署在网络边缘的计算模式,使得数据可以直接在靠近源头的位置处理。与云计算相比,边缘计算能满足低延迟和实时响应的需求,尤其适用于自动驾驶、智能制造等场景。

e7cad9128e969865ab01fb029b3b4414.png

边缘计算的三大优势:
  • 低延迟:数据在靠近源头的位置处理,无需传输至云端,响应时间显著降低。

  • 减轻网络负担:边缘计算设备完成初步数据处理,仅上传关键信息至云端,减少了网络流量压力。

  • 提升数据隐私保护:在本地处理敏感数据,无需频繁上传至云端,有助于保护用户隐私。

边缘计算在智能家居、智能交通、工业自动化等领域已经取得了显著成果。随着物联网设备的普及,边缘计算需求将不断增加,并与云计算形成相辅相成的架构。

768cbd5f50454ce392a30b4a6f356e08.png


存算一体化与边缘计算的结合:智能计算的加速器

存算一体化和边缘计算的结合,正逐步催生出一套更加高效的智能计算模式。由于边缘设备往往体积小、功耗低、算力有限,难以承担复杂的计算任务,而存算一体化能显著增强边缘设备的处理能力,使其更加高效、低能耗。以下是存算一体化与边缘计算的结合应用:

· 物联网设备的数据处理

物联网设备大多部署在网络边缘位置,用于实时监测环境数据。采用存算一体化技术的边缘设备能够在本地完成数据处理,减少不必要的上传。例如,搭载存算一体化芯片的智能摄像头可以直接分析视频数据,仅传输关键事件至云端,大大降低网络流量。

· 边缘AI推理

边缘计算在AI推理中的应用越来越广泛,如自动驾驶、智能医疗等场景。边缘AI推理通常需要处理大量实时数据,而存算一体化技术能够提高推理速度。比如,自动驾驶车辆可以在摄像头数据中直接完成识别和决策,确保快速响应。

· 工业实时控制

在工业场景中,设备需实时监控和控制。例如机械臂的控制、工厂设备的状态监测等。存算一体化使边缘设备具备实时数据处理能力,保障系统的快速响应,提升了工厂的自动化和智能化水平。

· 数据隐私保护

边缘设备常处理敏感数据,直接上传至云端会带来隐私风险。存算一体化在本地完成数据处理,减少上传需求,有助于提升数据隐私性和安全性。

6b0a337d0edca976388eecc4e8f06ec9.jpeg


技术趋势与挑战

虽然存算一体化和边缘计算结合前景广阔,但在技术落地过程中仍面临挑战:

  1. 硬件研发复杂:存算一体化技术涉及复杂的芯片设计和制造,如何在存储芯片内部高效集成计算单元仍是关键难题。芯片的工艺和计算精度也需要进一步提升。

  2. 设备多样性与适配难题:边缘设备种类繁多、资源配置差异较大,如何提供通用的存算一体化解决方案是技术难点。未来需设计低成本、高通用性的存算一体化边缘芯片。

  3. 软件生态支持:存算一体化架构需要完整的软件支持,例如优化的编译器、计算框架和编程工具链,开发者需针对硬件架构优化算法和模型。

  4. 隐私和安全保障:边缘计算设备处理大量数据,如何保障数据加密和隐私安全也是技术发展的重点。


展望:智能计算的未来

随着存算一体化和边缘计算技术的成熟,智能计算将迎来低延迟、低能耗、高效率的新阶段。我们可以预见以下趋势:

  • 边缘AI应用普及:存算一体化和边缘计算的结合使得边缘AI计算变得高效,更多智能应用将在边缘设备上实现。

  • 智能终端设备的自主化:存算一体化提升了边缘设备的计算能力,减少对云端依赖,使设备更具自主性。

  • 低能耗的分布式计算模式:存算一体化减少数据传输能耗,边缘计算的分布式架构能降低云端负荷,使得网络资源更高效。

未来,存算一体化与边缘计算的融合将推动智能计算从集中化向分布式发展、从高能耗走向低能耗。它们将成为构建智能社会的重要基石,使我们身边的智能设备更高效、更安全,朝着真正的“万物互联”时代迈进。

edd6a0fafb926b75e29a59ac31b3bee9.png

如果您也对边缘AI感兴趣,诚挚邀请您参加今年12月14日在上海举办的第十届全球边缘计算大会!边缘5年,逐梦同行!

5753a3a9b2a7998f03a4783c126cc150.jpeg

边缘五年,逐梦前行——第十届全球边缘计算大会强势回归!

重磅发布 | 2024边缘计算产业图谱,揭示行业未来新格局!

2024-10-31

3aa9538f7fdaae2cbc1314fc8acf4231.jpeg

新趋势|工业AI正在转向——边缘人工智能(Edge AI)

2024-10-20

02efd00338ef95906cef1b3830fb7687.jpeg

干货丨《边缘算力蓝皮书》附下载

2024-10-10

fcc6ef822cd4cad6406e1fc6aac069a5.jpeg

推荐一本我们的书!绝版珍藏!🌟

2024-04-22

c34c2aaad6e67b41b707059546e95066.jpeg

重磅来袭!“2024中国边缘计算企业20强”榜单发布!

2024-04-09

b306c587be55dad97f63636fd1d7adec.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/912597.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Kubernetes-ArgoCD篇-03-部署

1、从 Git 存储库创建应用程序 包含留言簿应用程序的示例存储库可在 https://github.com/argoproj/argocd-example-apps.git 上找到,以演示 Argo CD 的工作原理。 1.1 argocd server port-forward 我们这里通过port-forward 访问 Argo CD: kubectl p…

6层板设计常用知识笔记

1. 6层板设计叠层方案 (1)叠层方案优选以下方式 (2)过孔做固定孔时 plated作为固定孔时需要去掉勾选,焊盘去金属化。 (3)屏蔽罩:电源、主控存储、wifi需要加屏蔽罩,屏蔽…

【mongodb】数据库的安装及连接初始化简明手册

NoSQL(NoSQL Not Only SQL ),意即"不仅仅是SQL"。 在现代的计算系统上每天网络上都会产生庞大的数据量。这些数据有很大一部分是由关系数据库管理系统(RDBMS)来处理。 通过应用实践证明,关系模型是非常适合于客户服务器…

Unity跨平台基本原理

目录 前言 ​编辑 Mono Unity和Mono的关系 Unity跨平台必备概念 Mono利用 Mono主要构成部分 基于Mono跨平台的优缺点 IL2CPP Mono和IL2CPP的区别 Mono IL2CPP Mono和IL2CPP的使用建议 安装IL2CPP IL2CPP打包存在的问题 类型裁剪 泛型问题 前言 Unity跨平台的基…

【go从零单排】接口(interface)和多态(Polymorphism)

🌈Don’t worry , just coding! 内耗与overthinking只会削弱你的精力,虚度你的光阴,每天迈出一小步,回头时发现已经走了很远。 📗概念 在Go语言中,interface 是一种重要的类型,用于定义一组方法…

Science Robotics 综述揭示演化研究新范式,从机器人复活远古生物!

在地球46亿年的漫长历史长河中,生命的演化过程充满着未解之谜。如何从零散的化石证据中还原古生物的真实面貌?如何理解关键演化节点的具体过程?10月23日,Science Robotics发表重磅综述,首次系统性提出"古生物启发…

WPS文档中的“等线”如何删除

如何删除“等线”占用的行如何删除表格之间的空行WPS文档中的“等线”是什么如果删除脚注文本占用的行 如下这种,在文档中添加了表格和脚注,发现上下表格之间有多行空行,鼠标选中,显示是“等线”,那么如何去除等线占用…

开源办公软件OnlyOffice的使用教程以及8.2版本的更新功能测评

OnlyOffice 8.2 是一款功能全面的在线办公套件,在实际使用中,PDF协作编辑功能给我留下了深刻印象,让团队成员能够轻松共同编辑PDF并签署文档。这些改进不仅增强了协作效率,也让办公体验更加流畅和高效。如果你的团队需要一个集协作…

C/C++/PYTHON 改变 console terminal cmd 字体输出颜色

C代码 #include <stdio.h>// 定义一些常用颜色的转义序列 #define RED "\x1b[31m" #define GREEN "\x1b[32m" #define YELLOW "\x1b[33m" #define BLUE "\x1b[34m" #define RESET "\x1b[0m"int main() {// 在控制台输…

数据分析反馈:提升决策质量的关键指南

内容概要 在当今快节奏的商业环境中&#xff0c;数据分析与反馈已成为提升决策质量的重要工具。数据分析不仅能为企业提供全面的市场洞察&#xff0c;还能帮助管理层深入了解客户需求与行为模式。掌握数据收集的有效策略和工具&#xff0c;企业能够确保获得准确且相关的信息&a…

Unity性能优化 -- 性能分析工具

Stats窗口Profiler窗口Memory Profiler其他性能分析工具&#xff08;Physica Debugger 窗口&#xff0c;Import Activity 窗口&#xff0c;Code Coverage 窗口&#xff0c;Profile Analyzer 窗口&#xff0c;IMGUI Debugger 窗口&#xff09; Stats 统级数据窗口 game窗口 可…

ELK-ELK基本概念_ElasticSearch的配置

文章目录 一、什么是ELK&#xff1f;有什么用&#xff1f;ELK是什么&#xff1f;ElasticsearchLogstashKibana ELK的作用要注意ELK的三个组件的版本需要相互兼容版本兼容性的一般原则版本兼容性对照表ELK Stack 6.x 系列ELK Stack 7.x 系列 版本升级和兼容性注意事项注意事项2 …

【网络安全 | 并发问题】Nginx重试机制与幂等性问题分析

未经许可,不得转载。 文章目录 业务背景Nginx的错误重试机制proxy_next_upstream指令配置重试500状态码非幂等请求的重试问题幂等性和非幂等性请求non_idempotent选项的使用解决方案业务背景 在现代互联网应用中,高可用性(HA)是确保系统稳定性的关键要求之一。为了应对服务…

spring—boot(整合redis)

整合redis 第一步导入数据源 <!--redis--> <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis</artifactId> </dependency> RedisConfig&#xff08;默认有RedisTemplate&#…

关于倍速播放百度网盘视频

免责声明&#xff1a; 下述内容均为自学探索&#xff0c;仅供学习交流&#xff01;&#xff01;&#xff01; 【侵权删】 正文&#xff1a; 倍速播放百度网盘视频&#xff0c;检索到的通常有&#xff1a;1、使用夸克浏览器倍速播放&#xff1b;2、使用ipad 快捷命令。 推荐…

对HFSS中的结构使用Icepak进行热仿真-以微带电路为例-含工程

对HFSS中的结构使用Icepak进行热仿真-以微带电路为例-含工程 在HFSS中依据厂家模型自己进行连接器仿真—以SMP接口为例中分析了基于现有的结构在HFSS中对连接器进行3D建模&#xff0c;下面基于这个模型简要介绍如何在HFSS中进行热仿真。 下载链接&#xff1a;对HFSS中的结构使…

如何处理模型的过拟合和欠拟合问题

好久没有写人工智能这块的东西了&#xff0c;今天正好在家休息&#xff0c;给大家分享一下最近在训练时遇到的过拟合和欠拟合的问题&#xff0c;经过仔细的思考&#xff0c;总结如下&#xff1a; 在处理模型的过拟合和欠拟合问题时&#xff0c;我们需要根据具体情况采取不同的…

【EFK】Linux集群部署Elasticsearch最新版本8.x

【EFK】Linux集群部署Elasticsearch最新版本8.x 摘要环境准备环境信息系统初始化启动先决条件 下载&安装修改elasticsearch.yml控制台启动Linux服务启动访问验证查看集群信息查看es健康状态查看集群节点查询集群状态 生成service token验证service tokenIK分词器下载 摘要 …

省级基础设施水平数据(2000-2022年)

基础设施不仅是社会生产和居民生活的基础&#xff0c;也是国民经济各项事业发展的基石。本文将通过计算公式“基础设施水平公路里程/年末人口数”&#xff0c;结合《中国统计年鉴》和国家统计局的数据&#xff0c;对基础设施水平进行量化分析 2000年-2022年省级基础设施水平数…

关于stm32中IO映射的一些问题

在STM32固件库&#xff08;比如HAL或LL库&#xff09;中&#xff0c;GPIO的寄存器映射已经定义好了&#xff0c;开发者可以通过标准的读写操作访问GPIO引脚的状态。 一、我们可以直接通过位移操作来修改特定值。 二、下面我们提供另一种方法&#xff0c;位带操作 首先要定义一…