物联网设备研究——分配推理负载的联合学习方法

物联网设备研究——分配推理负载的联合学习方法

article2025/2/21 19:37:16/文章来源:https://blog.csdn.net/matt45m/article/details/143752967

概述

物联网（IoT）的最新发展导致人工智能模型被嵌入到传感器和智能手机等终端设备中。这些模型是根据每个设备的存储容量和计算能力定制的，但重点是在终端侧进行本地推理，以降低通信成本和延迟。

然而，与部署在边缘服务器或云端的更先进模型相比，设备上的模型往往表现不佳。为了解决这个问题，有人提出了合作推理系统（CIS），它允许能力较弱的设备将部分推理任务卸载给功能更强大的设备，从而提高了整体性能。

此外，由于 CIS 操作中客户之间提供服务的异质性很高，传统的培训方法往往无法提供足够的性能。本研究提出了一种专为 CIS 设计的新的联合学习（FL）方法，该方法允许在培训模型中考虑每个客户服务提供率的变化。

这一新框架不仅提供了理论保证，而且在性能上优于 CIS 的最先进训练算法。这在推理请求频率和数据可用性因客户而异的情况下尤其如此。

相关研究

协作推理系统（CIS）和联合学习（FL）是在终端设备和边缘服务器等分布式环境中有效运行人工智能模型的关键技术。开发这些技术是为了应对终端设备的异构计算和存储能力，同时降低通信成本和保护数据隐私。

FL 基础知识和 CIS 整合

联盟学习是一种在客户端之间不共享数据的情况下联合训练模型的框架。这确保了数据的私密性，而且训练直接在终端设备生成的数据上进行。这可以通过 FedAvg 和 FedProx 等算法来实现，它们提出了一种新方法，可以高效地训练具有不同模型大小的多个客户端。

CIS 的应用和挑战

CIS 的目的是将计算任务分配给网络中的不同设备，以改善特定推理任务的响应时间。例如，利用早期退出（early exit）网络和有序剔除（ordered dropouts）等技术，系统会自动调整，使更强大的模型负责计算要求高的任务。然而，有效训练这些模型的方法尚未得到充分研究。

最先进的 FL 技术

FL 中的知识提炼和参数共享等技术可实现模型之间的知识转移。即使在不同架构的模型共存的环境中，也能提高模型的整体性能。还有人尝试生成不同大小的子模型，并使其适应异构客户端，如 FjORD 框架。

以前的工作主要集中在模型放置和合作策略的优化上，而本研究则致力于 CIS 环境中的模型训练方法。具体来说，它根据不同客户端的推理请求频率提出了一个优化问题，并提出了一种新颖的 FL 方法。其目的是消除终端设备之间推理性能的差异，提高整个系统的效率。

建议方法

本研究针对协作推理系统（CIS）提出了一种新颖的联合学习（FL）方法。该方法可在考虑到 CIS 环境中推理请求的频率和客户数据可用性差异的情况下进行模型训练。主要特点和方法如下。

考虑到推理服务限制的优化问题：该方法考虑到了客户推理请求的异质性，并将这种情况表述为一个优化问题。具体来说，它根据推理请求的频率调整每个模型的训练权重，从而平衡推理任务。

∙ 最小化加权损失函数：建议的算法旨在最小化来自不同客户端的损失加权总和。权重基于推理请求的频率，可能因每个客户端的计算能力而异。

-计算能力强的客户提供协助：计算能力强的客户根据预设概率参与模型训练，以协助计算能力较弱的客户。这可以提高模型的整体性能，保证推理的准确性。

试验

为了评估所提出的联合学习算法的性能，我们在 CIFAR-10 数据集上进行了详细的实验。这些实验是在考虑到不同客户端数据可用性和推理请求频率差异的环境下进行的，目的是验证所提算法的性能和适应性。

实验数据集

使用的主要数据集是 CIFAR-10，这是一个通常用于图像识别任务的数据集。在实验中，数据集分布在不同的云、边缘和设备拓扑结构中，以便在每个环境中训练和推断模型。

与基线模型的比较

我们将提议的算法与现有的联合学习算法进行了比较，并对其性能进行了评估。特别是，它与 FedAvg 和 FedProx 等流行的联合学习算法进行了比较，目的是让所提出的方法比这些算法显示出更好的适应性和性能。

绩效评估结果（表 2）

实验结果显示了使用 CIFAR-10 数据集在不同客户端设置下的推理性能。这证实了所提出的算法在解决客户端数据异质性问题的同时，提高了整体推理任务的效率。

验证理论保证

实验证明，所提出的算法实现了理论上预测的性能提升。这表明，该算法能够在不同的客户端环境中保持一致的推理性能。

这些实验结果表明，针对分布式环境中的推理任务，所提出的联合学习算法是一种实用而有效的解决方案，表明它可以广泛应用于 CIS 环境。

结论

本研究提出了一种专门用于协作推理系统（CIS）的新型联合学习（FL）框架。该方法根据每个客户端的服务交付率调整模型的训练，同时考虑到推理请求的频率和客户端之间数据可用性的差异，从而优化整体推理性能。通过实验，与传统的 FL 方法相比，所提出的算法显示出更优越的性能，为在异构设备环境中进行高效推理提供了可能。

未来展望

基于本研究中开发的 FL 方法所取得的成功，它有望应用于更多的场景和不同的数据集。特别是，该算法有望在物联网和移动设备大量存在的现实世界中得到扩展和应用。未来，进一步优化模型训练过程和开发适应策略以应对不同的网络条件和设备限制将非常重要。

此外，隐私保护和增强安全性是基于 FL 的应用中的核心问题，需要在今后的研究中更详细地加以解决。在拟议框架的基础上，探索在不损害隐私的情况下有效利用数据的新方法可能是未来研究的一部分。

最后，将这一研究方法应用于其他机器学习模型和算法可促进其在不同行业的实施，并有助于在 CIS 环境中进一步建立高效的运行模型。

注：
论文地址：https://arxiv.org/pdf/2405.04249

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/914987.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

CentOS Stream 9设置静态IP

CentOS Stream 9设置静态IP

CentOS Stream 9设置静态IP CentOS Stream 9作为CentOS Stream发行版的下一个主要版本，已经发布有一段时间，但与目前广泛使用的CentOS7有较大区别。安装试用Stream 9的过程中，就发现设置静态IP的方式和CentOS7/8差别较大，在此记录…

阅读更多...

【嵌入式】ESP32开发（一）ESP-IDF概述

【嵌入式】ESP32开发（一）ESP-IDF概述

文章目录 1 前言2 IDF环境配置3 在VS Code中使用IDF3.1 使用ESP-IDF例程3.2 底部按钮的作用【重要！】3.3 高级用法4 ESP-IDF框架分析5 从零开始创建一个项目5.1 组件（component）6 主要参考资料7 遇到的一些问题与解决办法8 对于ESP-IDF开发的一些感受1 前言对于ESP32的开发…

阅读更多...

基于Multisim水箱水位控制系统仿真电路（含仿真和报告）

基于Multisim水箱水位控制系统仿真电路（含仿真和报告）

【全套资料.zip】水箱水位控制系统仿真电路Multisim仿真设计数字电子技术文章目录功能一、Multisim仿真源文件二、原理文档报告资料下载【Multisim仿真报告讲解视频.zip】功能 1.在水箱内的不同高度安装3根金属棒，以感知水位变化情况， 液位分1&…

阅读更多...

解读Nature：Larger and more instructable language models become less reliable

解读Nature：Larger and more instructable language models become less reliable

目录 Larger and more instructable language models become less reliable 核心描述核心原理创新点举例说明大模型训练，微调建议 Larger and more instructable language models become less reliable 这篇论文的核心在于对大型语言模型（LLMs）的可靠性进行了深入…

阅读更多...

zabbix监控端界面时间与服务器时间不对应

zabbix监控端界面时间与服务器时间不对应

1. 修改系统时间 # tzselect Please select a continent, ocean, "coord", or "TZ".1) Africa2) Americas3) Antarctica4) Asia5) Atlantic Ocean6) Australia7) Europe8) Indian Ocean9) Pacific Ocean 10) coord - I want to use geographical coordina…

阅读更多...

ubuntu20.04安装FLIR灰点相机BFS-PGE-16S2C-CS的ROS驱动

ubuntu20.04安装FLIR灰点相机BFS-PGE-16S2C-CS的ROS驱动

一、Spinnaker 安装 1.1Spinnaker 下载下载地址为： https://www.teledynevisionsolutions.com/support/support-center/software-firmware-downloads/iis/spinnaker-sdk-download/spinnaker-sdk–download-files/?pnSpinnakerSDK&vnSpinnakerSDK 在上述地址中…

阅读更多...

Windows配置JDK

Windows配置JDK

1、解压下载以后解压，放在一个没有中文路径和没有空格的目录，如下图： 2、配置Java环境 1）、点击左下角windows图标，输入huanjing（或者path），打开环境变量配置如图： …

阅读更多...

Unity教程（十八）战斗系统攻击逻辑

Unity教程（十八）战斗系统攻击逻辑

Unity开发2D类银河恶魔城游戏学习笔记 Unity教程（零）Unity和VS的使用相关内容 Unity教程（一）开始学习状态机 Unity教程（二）角色移动的实现 Unity教程（三）角色跳跃的实现 Unity教程&…

阅读更多...

HCIP-HarmonyOS Application Developer 习题（二十三）

HCIP-HarmonyOS Application Developer 习题（二十三）

1、（多选）端云一体化已经集成以下哪些服务SDK。 A、云函数 B、云数据库 C、云存储 D、云托管答案：AB 分析：云开发即为应用开发云侧工程，目前包含云函数与云数据库工程。 2、（多选）Entry下的m…

阅读更多...

图数据库 | 5、图数据库三大组件之一之图计算（下）

图数据库 | 5、图数据库三大组件之一之图计算（下）

书接上文：图数据库 | 4、图数据库三大组件之一 ——图计算 （上）-CSDN博客结合计算效率来评估与设计图计算所需的数据结构。存储低效性或许是相邻矩阵或关联矩阵等数据结构的最大缺点，尽管它有着O(1)的访问时间复杂度。例如通过…

阅读更多...

Android OpenGL ES详解——纹理：纹理过滤GL_NEAREST和GL_LINEAR的区别

Android OpenGL ES详解——纹理：纹理过滤GL_NEAREST和GL_LINEAR的区别

目录一、概念 1、纹理过滤 2、邻近过滤 3、线性过滤二、邻近过滤和线性过滤的区别三、源码下载一、概念 1、纹理过滤当纹理被应用到三维物体上时，随着物体表面的形状和相机视角的变化，会导致纹理在渲染过程中出现一些问题，如锯齿…

阅读更多...

【java】java通过s3访问ceph报错

【java】java通过s3访问ceph报错

1.报错信息、背景工作中起了几个访问ceph的服务pod节点，一段时间后1个节点一直报错Unable to execute HTTP request: Timeout waiting for connection from pool，详细i信息如下图片，有且仅有1个节点报错，其他节点访问正常。看日志…

阅读更多...

对于目标文件太大无法拉入u盘事件的解决方法

对于目标文件太大无法拉入u盘事件的解决方法

问题： 解决方法： 1.按住win r 键打开运行，输入cmd，点击确定。 2.输入convert 盘符(你自己的u盘的盘符): /fs:ntfs并单击回车

阅读更多...

React Hooks在现代前端开发中的应用

React Hooks在现代前端开发中的应用

💓 博客主页：瑕疵的CSDN主页 📝 Gitee主页：瑕疵的gitee主页 ⏩ 文章专栏：《热点资讯》 React Hooks在现代前端开发中的应用 React Hooks在现代前端开发中的应用 React Hooks在现代前端开发中的应用引言 React Hooks …

阅读更多...

Linux（CentOS）yum update -y 事故

Linux（CentOS）yum update -y 事故

CentOS版本：CentOS 7 事情经过： 1、安装好CentOS 7，系统自带JDK8，版本为：1.8.0_181 2、安装好JDK17，版本为：17.0.13 3、为了安装MySQL执行了 yum update -y（这个时候不知道该命令的…

阅读更多...

【操作系统】输入/输出（I/O）管理

【操作系统】输入/输出（I/O）管理

王道笔记一、I/O管理描述 1.1 I/O设备的概念和分类 1.1.1 什么是I/O设备 “I/O”就是“输入/输出”（Input/Output） I/O设备机会可以将数据输入到计算机，或者可以接收计算机输出数据的外部设备，属于计算机中的硬件部件。下图就…

阅读更多...

HarmonyOS App 购物助手工具的开发与设计

HarmonyOS App 购物助手工具的开发与设计

文章目录摘要引言功能需求分析技术方案与设计架构设计技术选型代码示例Demo数据抓取模块数据存储模块历史价格查询和数据可视化模块完整界面布局和调用示例代码详解 QA环节总结参考资料摘要随着促销活动的增多，用户面临真假折扣的困惑，特别是在一些…

阅读更多...

$激活函数解析：神经网络背后的“驱动力”$

激活函数解析：神经网络背后的“驱动力”

神经网络中的激活函数（Activation Function）是其运作的核心组件之一，它们决定了神经元如何根据输入信号进行“激活”，进而影响整个模型的表现。理解激活函数的工作原理对于设计和优化神经网络至关重要。本篇博客将深入浅出地介绍各…

阅读更多...

昇思大模型平台打卡体验活动：项目1基于MindSpore实现BERT对话情绪识别

昇思大模型平台打卡体验活动：项目1基于MindSpore实现BERT对话情绪识别

基于MindSpore实现BERT对话情绪识别 1. 模型简介 BERT（Bidirectional Encoder Representations from Transformers）是由Google于2018年末开发并发布的一种新型语言模型，基于Transformer架构中的Encoder，并且具有双向编码的特性。…

阅读更多...

【vue】echarts地图添加蒙版图片，多图层地图实现天气信息展示

【vue】echarts地图添加蒙版图片，多图层地图实现天气信息展示

实现原理：多层图层叠加实现复杂的信息展示。 <template><div class"wrapper"><el-drawertitle"天气信息":modal"iszz":visible.sync"weatherinfo":direction"direction"><drawer:labelnam…

阅读更多...

最新文章