【联邦学习贡献评估——联邦学习优化】

1. 模型复用

贡献评估往往需要计算不同参与方组合的数据价值, 然而模型相关的价值度量指标, 比如测试准确率, 需要基于数据重新训练并评测模型, 这导致了高昂的数据价值度量代价. 为了避免重复训练联邦模型的代价, 考虑复用全体参与方组合下训练联邦模型时各参与方的梯度更新, 避免在其他参与方子组合下训练模型时各 参与方重复的梯度计算, 大大减少模型训练相关的代价。

直接方式(不推荐):对于每个参与方子 组合, 复用相关参与方的梯度更新来完成模型的多轮次训练, 然后评测模型度量子组合数据价值. 但是因为 复用的梯度值不能代表参与方子组合数据的最优梯度方向, 经过多轮次训练后, 模型训练的累积误差大, 导 致近似价值度量不够准确.

合适的思路:评估各参与方在每轮次训练的贡献, 聚合多轮贡献来评估 参与方在联邦合作中的贡献

具体的思路:,

  1. 全体参与方合作训练联邦模型, 在每轮次中, 根据本地数据向联 邦发送梯度更新, 联邦枚举不同参与方组合梯度计算各参与方在本轮次的贡献期望, 然后, 联邦聚合所有参 与方梯度完成本轮次的全局模型更新.
  2. 基于每轮次评估参与方贡献的设定, 实现了在梯度复用的同时 , 大大 提升评估的准确性. 但是由于每轮次均需要评测模型性能, 评测次数随训练轮次线性增大, 加大了模型评测的代价.

缺陷的解决方案1:Wang 等人在每轮次评估中仅采样部分参与方进行贡献评估, 并将未被采样的参与方在该轮次的贡献视为 0. 然而, 由于模型训练的性能提升增益随训练轮次 逐渐收敛, 该方法对于未在靠前轮次中被采样到的参与方不公平.

解决方案1的补充:为了提升每轮次仅采样部分参与方进行贡献评估的公平性, 观察到多轮次不同参与方组合价值构成的矩 阵具有低秩特性, 可以将价值度量转换为采样下的低秩矩阵补全问题.

2. 模型剪枝

在联邦参与方贡献评估过程中, 从采样排列中参与方的边际价值增益、模型多轮次训练的性能提升和数 据样本这 3 个层面, 均可以进行剪枝优化.

  • 排列剪枝
    • 在贡献评估的随机采样优化中, 对于每个排列, 需要从前往后计算每个参与方加入前缀参 与方组合带来的边际贡献. 在假定所有参与方的边际贡献非负的情况下, 排列从前往后引入新参与 方的过程中, 前缀参与方组合的数据价值逐渐趋近于全体参与方组合的价值.
    • 因此, 可以设置边际增 益阈值, 当排列中参与方前缀组合的价值与全体参与方组合的价值差小于阈值时, 往后的参与方不 会带来显著边际增益, 因此可以剪枝停止计算引入剩余参与方的组合数据价值, 有效地提升参与方 数量庞大情况下的计算效率
  • 训练剪枝
    • 机器学习模型往往需要多轮次训练才能收敛, 为了降低数据估值任务中模型的训练代价, 不必像模型应用性能测评中一样, 尽可能地让模型收敛, 在模型性能提升波动小于一定程度时进行 剪枝, 提早结束模型训练. 甚至为进一步提升联邦数据评估效率, 可以根据任务复杂度适当提升模型 学习率, 仅进行单轮次模型训练
  • 数据剪枝
    • 基于局部相关特性, 联邦采用 K 近邻任务模型可实现贡献评估的数据样本剪枝。
    • K 近邻 方法价值计算仅关联到离测试样本最近的 k 条训练数据样本, 可忽略离测试样本距离过远的数据样 本, 因此可以对远距离样本剪枝来提升贡献评估效率.

3. 模型性能优化

在联邦学习实践中, 无法保证所有参与方均提供高价值无恶意的数据. 为了保证联邦学习效果 , 抵御恶意参与方攻击是联邦学习的一个重要研究议题[77]. 从优化联邦学习效果角度出发, 贡献评估技术可用于优化 联邦模型训练, 即择优选择参与方数据, 优化参与方参与程度, 减少使用低价值或恶意参与方数据, 降低恶意 参与方对模型性能的负面影响。

  • 按贡献调整联邦参与程度
    • 根据参与方的贡献大小, 调整参与方在联邦训练中的参与程度. 在经典联 邦学习中, 所有参与方在联邦合作中参与程度仅与数据量挂钩, 即基于 FedAvg, 按照各参与方数据 量加权聚合各参与方的梯度更新.
  • 设阈值移除低贡献参与方
    • 当不存在完备联邦测试集时, 可以根据参与方之间交叉验证来鉴定并移 除低贡献参与方.
  • 按贡献奖励不同任务模型.
    • 在很多联邦学习设定中, 参与方参与联邦学习的目的是获取性能更高的 任务模型, 因此, 可以通过贡献大小来奖励相应性能的任务模型来避免低价值或者恶意参与方. 实现 参与方按贡献获得不同任务模型, 需要改变经典联邦学习中每轮次训练后联邦同步最新全局模型给 每个参与方的设定.

4. 相关的论文

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/475994.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

tcp seq ack

seq(Sequence Number):32bits,表示这个tcp包的序列号。tcp协议拼凑接收到的数据包时,根据seq来确定顺序,并且能够确定是否有数据包丢失。 ack(Acknowledgment Number):3…

【热门话题】深入浅出:npm常用命令详解与实践

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 标题:深入浅出:npm常用命令详解与实践引言一、npm基本概…

基于SpringBoot和Vue的大学生租房系统的设计与实现

今天要和大家聊的是一款今天要和大家聊的是一款基于SpringBoot和Vue的大学生租房系统的设计与实现。 !!! 有需要的小伙伴可以通过文章末尾名片咨询我哦!!! 💕💕作者:李同…

力扣爆刷第102天之hot100五连刷96-100

力扣爆刷第102天之hot100五连刷96-100 文章目录 力扣爆刷第102天之hot100五连刷96-100一、136. 只出现一次的数字二、169. 多数元素三、75. 颜色分类四、31. 下一个排列五、287. 寻找重复数 一、136. 只出现一次的数字 题目链接:https://leetcode.cn/problems/sing…

YOLOv3学习

YOLOv3仅使用卷积层,使其成为一个全卷积网络(FCN)。文章中,作者提出一个新的特征提取网络,Darknet-53。正如其名,它包含53个卷积层,每个后面跟随着batch normalization层和leaky ReLU层。没有池…

基于springboot的医院医护人员排班系统

技术:springbootvuemysql 一、系统背景 本医护人员排班系统管理员,医护。管理员功能有个人中心,医院信息管理,医护信息管理,医护类型管理,排班信息管理,排班类型管理,科室信息管理&…

vivado 增量实施

增量实施 增量实现是指增量编译的实现阶段设计流程: •通过重用参考设计中的先前布局和布线,保持QoR的可预测性。 •加快地点和路线的编制时间或尝试最后一英里的计时关闭。 下图提供了增量实现设计流程图。该图还说明了增量合成流程。有关增量的更多…

一命通关广度优先遍历

前言 在这篇文章之前,已对非线性结构遍历的另一种方法——深度优先遍历进行了讲解,其中很多概念词都是共用的。为了更好的阅读体验,最好先在掌握或起码了解dfs的基础上,再来阅读本文章,否则因为会有很多概念词看不明白…

每日五道java面试题之mybatis篇(六)

目录: 第一题. MyBatis⽀持动态SQL吗?第二题. 说说Mybatis的⼀级、⼆级缓存?第三题. MyBatis的功能架构是什么样的?第四题. 为什么Mapper接⼝不需要实现类?第五题. 说说Mybatis的插件运⾏原理,如何编写⼀个…

GEE入门及进阶教程|使用表达式处理图像

目录 1.EVI的算术计算 2.使用表达式计算 EVI 3.使用表达式计算 BAI 1.EVI的算术计算 增强植被指数 (EVI) 旨在最大限度地减少 NDVI 的饱和度和其他问题,在叶绿素含量高的地区(例如雨林),EVI 不会像 NDVI 那样饱和(即…

转置卷积(transposed-conv)

一、什么是转置卷积 1、转置卷积的背景 通常,对图像进行多次卷积运算后,特征图的尺寸会不断缩小。而对于某些特定任务 (如图像分割和图像生成等),需将图像恢复到原尺寸再操作。这个将图像由小分辨率映射到大分辨率的尺寸恢复操作&#xff0c…

spring boot3登录开发-2(2短信验证码接口实现)

⛰️个人主页: 蒾酒 🔥系列专栏:《spring boot实战》 🌊山高路远,行路漫漫,终有归途 目录 写在前面 上文衔接 内容简介 短信验证码接口实现 1.依赖导入 2.接口分析 3.实现思路 3.功能实现 创建发送短信…

USART串口控制LED灯

#include "uart4.h"void uart4_init() {//使能GPIORCC->MP_AHB4ENSETR |(0x1<<1);RCC->MP_AHB4ENSETR |(0x1<<6);//使能UART4RCC->MP_APB1ENSETR |(0x1<<16) ;//GPIO MODER设置 复用模式设置GPIOB->MODER |(0x2<<4);G…

C语言例:设 int i=2;float f=14;,则执行语句f=(float)i; 后。变量i 的值

代码如下&#xff1a; #include<stdio.h> int main(void) {int i2;float f14;f(float)i;printf("i %d\n",i); //i2//强制转换不会改变数据类型printf("i %.1f\n",i);return 0; } 结果如下&#xff1a;

【Leetcode每日一题】 递归 - 两两交换链表中的节点(难度⭐)(38)

1. 题目解析 题目链接&#xff1a;24. 两两交换链表中的节点 这个问题的理解其实相当简单&#xff0c;只需看一下示例&#xff0c;基本就能明白其含义了。 2.算法原理 一、理解递归函数的含义 首先&#xff0c;我们需要明确递归函数的任务&#xff1a;给定一个链表&#xf…

网速监控,实时网络速度监控

带宽与网速 现在&#xff0c;对高带宽的需求空前高涨&#xff0c;而且网络&#xff08;包括标准的内部部署&#xff09;以及公共、私有和混合环境都变得更加复杂。 虽然带宽和网速经常互换使用&#xff0c;但它们并不总是相同的。网速更多的是与延迟有关&#xff0c;而不是与…

es 集群核心概念以及实践

节点概念&#xff1a; 节点是一个Elasticsearch的实例 本质上就是一个JAVA进程一台机器上可以运行多个Elasticsearch进程&#xff0c;但是生产环境一般建议一台机器上只运行一个Elasticsearch实例 每一个节点都有名字&#xff0c;通过配置文件配置&#xff0c;或者启动时候 -…

2024年【T电梯修理】模拟考试及T电梯修理模拟考试题库

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 T电梯修理模拟考试是安全生产模拟考试一点通生成的&#xff0c;T电梯修理证模拟考试题库是根据T电梯修理最新版教材汇编出T电梯修理仿真模拟考试。2024年【T电梯修理】模拟考试及T电梯修理模拟考试题库 1、【多选题】…

​CNC数控机床能否通过工业智能网关实现远程运维​?-天拓四方

随着工业4.0时代的来临&#xff0c;智能制造成为制造业转型升级的关键。CNC数控机床作为制造业的核心设备之一&#xff0c;其智能化、远程化的运维管理显得尤为重要。工业智能网关作为一种连接物理世界与数字世界的桥梁&#xff0c;为CNC数控机床的远程运维提供了强大的技术支撑…

急!苹果手机充电充不进去什么原因?

在使用苹果手机时&#xff0c;有时可能会遇到充电问题&#xff0c;即充电时无法正常充电的情况。这种情况可能会导致手机无法充电&#xff0c;影响手机的正常使用。虽然苹果手机通常具有良好的充电性能&#xff0c;但是出现充电问题也并非罕见。 在本文中&#xff0c;我们将探…