ABNDP: Co-optimizing Data Access and Load Balance in Near-Data Processing——论文泛读

ASPLOS 2023 Paper 论文阅读笔记整理

问题

近数据处理(NDP)是一种很有前途的体系结构范式,可以解决数据密集型应用程序的内存墙挑战。基于3D堆叠存储器的典型NDP系统包含大量并行处理单元,每个并行处理单元都可以访问其本地存储器以及系统中的其他远程存储器区域。

现有方法局限性

在NDP体系结构中,最小化远程数据访问和实现计算负载平衡需要权衡。对于倾斜的负载,在离其数据位置更近的地方执行计算任务会导致负载不平衡产生热点。为确保负载平衡而动态调度任务不可避免地会使一些计算远离其数据的首选位置,从而导致更多的远程访问。现有技术[13,55,59,70,88]必须牺牲一种技术来改进另一种技术,从而限制NDP的性能和能源效益。

本文方法

本文提出了ABNDP,利用软硬件协同优化来同时缓解这两个问题。

  • 在硬件方面,使用了分布式DRAM缓存设计Traveller cache,在每个处理单元保留一小部分本地DRAM,以缓存来自远程存储器的数据。不允许在任何地方自由缓存数据,而是将每个数据块的缓存限制在NDP系统中分布的有限数量的camp位置。camp位置的缓存数据由附近的多个处理单元共享,提高了缓存空间利用率和数据重用时间,同时仍确保了较短的访问距离。进一步对不同的camp位置使用倾斜映射,减少缓存冲突。

  • 在软件方面,采用混合任务调度策略,同时考虑远程访问成本和负载不平衡影响。除了原始内存位置之外,用于缓存数据的多个camp位置为调度提供了更高的灵活性,这可以更好地分散热数据上的繁重计算,并减少任务中的总远程访问距离。偏斜的camp位置映射方案简化了访问多个数据的任务的调度。

评估表明,ABNDP成功地实现了最小化远程访问成本和保持负载平衡这两个目标,并且平均在性能(1.7×)和能耗(25%)方面显著优于基线系统。

实验

实验环境:zsim[77]模拟器

数据集:数据密集型应用。BFS、单源最短路径(sssp)、Page Rank(pr)、图卷积神经网络(gcn)、A*搜索(astar)、K最近邻(knn)、稀疏矩阵向量乘法(spmv)、K-means(kmeans)。

实验对比:加速比、能量消耗、远程访问次数、活跃核心数、

实验参数:数据集

总结

针对使用3D堆叠存储器的近数据处理(NDP)问题,现有方法难以同时实现最小化远程数据访问和计算负载平衡。本文提出ABNDP,利用软硬件协同优化来同时缓解这两个问题。(1)在硬件方面,使用了分布式DRAM缓存,在每个处理单元缓存远程存储器的数据。对处理单元分组(camp),每组缓存一份数据,缓存数据由附近的多个处理单元共享。进一步对不同的camp位置使用倾斜映射,减少缓存冲突。(2)在软件方面,采用混合任务调度策略,同时考虑远程访问成本和负载不平衡影响。可以调度到camp缓存附近,更好地分散热数据上的繁重计算,并减少任务中的总远程访问距离。

局限性:同一份数据缓存在多个DRAM,缓存一致性的开销应该较高,适用于数据修改较少的负载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/492534.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

YOLOv9改进策略:block优化 | SEAM提升小目标遮挡物性能

💡💡💡本文改进内容:SEAM提升小目标遮挡物性能,在多个数据集得到很好的验证 改进结构图如下: YOLOv9魔术师专栏 ☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️ ☁️☁️☁️…

Github实现push触发自动构建(包括提交代码到另一个仓库中和发布npm)

将指定内容自动更新到另一个代码仓库中 登录https://github.com,创建Personal access token: (1)github右上角,点击头像,进入Settings > Developer settings > Personal access tokens 下面的Tokens …

一名00后程序员初次使用低代码开发平台的感受

前言 大家好,我是小代,一名00后的Java后端开发工程师。我热爱编程,希望通过写博客来分享我的学习经验和心得。最近,我加入了一家专注于低代码开发平台的公司,这里的技术挑战和新颖性让我决定开始我的博客之旅。 工作…

3.1 SQL概述

SQL(Structured Query Language) 结构化查询语言,是关系数据库的标准语言 SQL是一个通用的、功能极强的关系数据库语言 功能:查询,数据库模式创建,数据库数据的插入与修改,数据库完整性、安全…

影响欧美货币对因素?fpmarkets提醒如何避免陷阱

欧元兑美元汇率不仅取决于美国经济数据,还取决于欧洲央行的报告。 美国经济数据不仅包括美联储利率和美国就业报告,还有美国石油储备、汽油储备和页岩油钻井平台数量的报告。fpmarkets发现更谨慎的投资者还会分析失业数据、平均时薪变化这些更细致的数据…

1.使用eNSP绘制拓扑图实训

1.实训目的 掌握使用eNSP绘制拓扑图的方法。 2.应用环境 某企业需要提升自己的网络环境,为了保证项目顺利的实施,需要使用eNSP事先绘制拓扑图。 3.实训设备 安装有eNSP的计算机。 4.实训内容 按照设…

矿场设备远程监控解决方案

矿场设备远程监控解决方案 在现代工业智能化进程中,针对矿场设备远程监控的解决方案显得尤为重要。这一方案旨在通过集成先进的信息技术与物联网技术,实现对矿场各类设备的实时、精准、高效的远程监控和管理,从而优化生产效率,降…

WHM中启用FTP功能

WHM面板上FTP功能默认是禁用的,我们在创建完cPanel账户之后,用到FTP去登录的时候会发现登录受限,这个时候可以去WHM面板上启用,这边以Hostease的独立服务器并且购买了cPanel面板为例,步骤如下: 1.先登陆WH…

what is apache?

Apache 通常指 Apache Software Foundation (ASF) 或 Apache HTTP Server,两者都是计算机软件领域的重要实体。 Apache 软件基金会 (ASF):Apache 软件基金会是一个开发开源软件项目的非营利组织。它为涵盖软件开发各个方面的广泛项目提供支持&#xff0c…

01背包-动态规划

01背包 易知状态转移方程为: dp[i][j] max(dp[i-1][j],dp[i-1][j-v[i]]w[i]) 代码 N,V map(int,input().split()) v, w [0],[0] # 体积v,价值w for i in range(N):a list(map(int,input().split()))v.append(a[0]) # 体积viw.append(a[1]) # 价值w…

【牛客】【刷题节】美团2024届秋招笔试第一场编程真题

1.小美的外卖订单【简单题】 题意理解: 这道题是简单题,主要是一个逻辑实现和判断的问题。但是简单题一般喜欢加一点小障碍,所以读题的时候就要比较注意一些约束条件。就比如这道题:过了15/20个测试用例,出现error, 当…

基于ssm的社区文化宣传网站论文

摘 要 随着科学技术的飞速发展,社会的方方面面、各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,社区文化宣传网站当然也不能排除在外。社区文化宣传网站是以实际运用为开发背景,运用软件工程开发方法&…

奇舞周刊第523期:来自 rust 生态的强烈冲击?谈谈 Leptos 在语法设计上的精妙之处...

奇舞推荐 ■ ■ ■ 来自 rust 生态的强烈冲击?谈谈 Leptos 在语法设计上的精妙之处 过去很长一段时间,前端框架们都在往响应式的方向发展。同时又由于 React hooks 的深远影响,函数式 响应式成为了不少前端心中最理想的前端框架模样。Solid …

语音情感分类(1)简单可运行项目(附代码)

1.目标 题主最开始是想做一个音乐情感分类的模型,但是查阅相关文献发现这个范围太大了,音乐情感特征包括文本,音频,甚至有的还有画面,是一个多模态的范畴。所以退而求其次,找了一个接近的语音情感分类来学…

Vmware虚拟机无法用root直连说明

Vmware虚拟机无法用root直连说明 背景目的SSH服务介绍无法连接检查配置 背景 今天在VM上新装了一套Centos-stream-9系统,网络适配器的连接方式采用的是桥接,安装好虚拟机后,在本地用ssh工具进行远程连接,ip、用户、密码均是成功的…

图片格式转换:快速将PNG转换为JPG的步骤

在我们的日常生活中,经常会遇到需要改变图片格式的情况,有时候,我们可能需要将PNG格式的图片转换为jpg格式,以适应不同的需求和应用场景;本文将介绍哥实用的方法和工具,帮助您顺利将png图片转换为jpg格式。 压缩图网站…

睿考网:注册会计师考试有什么题型?

注册会计师专业阶段考试共6门科目,各科目考试题型略有不同。 《会计》考试题型为单项选择题、多项选择题、计算分析题、综合题。 《审计》考试题型为单项选择题、多项选择题、综合题、简答题。 《税法》考试题型为单项选择题、多项选择题、综合题、计算问答题。 …

GPT提示词分享 —— 口播脚本

可用于撰写视频、直播、播客、分镜头和其他口语内容的脚本。 提示词👇 请以人的口吻,采用缩略语、成语、过渡短语、感叹词、悬垂修饰语和口语化语言,避免重复短语和不自然的句子结构,撰写一篇关于 [主题] 的文章。 GPT3.5&#…

代码随想录算法训练营Day36|LC435 无重叠区间LC763 划分字母区间LC56 合并区间

一句话总结:都是和昨天的用最少箭引爆气球类似的题。 原题链接:435 无重叠区间 计数不重叠的区间的个数,然后用总长度减去这个值即可。 class Solution {public int eraseOverlapIntervals(int[][] intervals) {Arrays.sort(intervals, (a,…

Linux进程调度CFS

1. 进程 1.1 什么是进程? 操作系统作为硬件的使用层,提供使用硬件资源的能力,而进程作为操作系统使用层,提供使用操作系统抽象出的资源层的能力。进程是指计算机中已运行的程序。进程本身不是基本的运行单位,而是线程…