联邦学习——学习笔记1:FedAvg算法

文章目录


本笔记参考自b站up主:丸一口

原视频链接

在这里插入图片描述

如上图,现有6个医院:眼科、儿科、妇科、骨科、综合医院1、综合医院2。中间节点为政府。

现政府要求用各个医院的数据训练某个模型,希望对某些疾病进行一些预测,数据如下图:
在这里插入图片描述
如果是传统方法,那就是六个医院直接把数据发送到政府处,然后政府那边做机器学习。

如果用联邦学习,那政府是不能直接接收其他医院的所有数据的,因为如果直接接收数据,会有一个严重问题,就是隐私泄露的问题。因为传数据的过程中可能会被拦截,并且大量数据传送过程中对带宽也是有较高要求。

联邦学习的具体解决方案:中心节点初始化一个模型,把这个初始模型发给其他节点,其他节点在自己的地方做训练,训练结束后,把训练好的模型传到中心节点。然后中心节点做一个加权平均。然后中心节点再把模型发给其他节点,重复上述广播模型,上传模型操作。一直到中心节点认为准确率达到要求后,停止操作。

可以看到,联邦学习的过程中,中心节点是没有在本地存储数据的,这样就保证了数据的隐私。并且中心节点在没有数据的情况下,也能达到训练所有其他节点数据的效果。

在这里插入图片描述
再来看数据分布的问题:IID和Non-IID
ps:IID:independent identical distribution

这里的独立同分布
独立:就类似概率论里面两个事件发生互不影响。
同分布:如上图的综1和综2,它两个的数据分布情况都相同,都是均匀分布。

对于上图中的数据,如果我们仅仅用综合医院1的数据是不是也可以做到各个方面数据的训练?那为什么还需要其他的医院数据一起训练?

因为我们在机器学习训练的过程中,数据是训练的越多,对一些疾病的预测是更准确的,拟合效果也是更好的。

另外,虽然综合医院1可以对眼CT、胸CT、腿CT的数据分别训练。但是单眼CT来说,眼科医院的数据一方面更多,另一方面肯定也是更精确的。
在这里插入图片描述

在这里插入图片描述

在神经网络中,其实就是一个带权无向图。以上图中h1为例
前向传播
在这里插入图片描述
在这里插入图片描述
利用公式IN=i1w1+i2w2,我们得到h1的IN的数据,把这个数据称之为net值
在这里插入图片描述
而h1数据从第二层传给第三层时,还需要经过一个处理,也就是激活函数。
激活函数的作用就是不让网络数据线性的往下传递,每一层进行一点干扰,这样非线性的传递,才能拟合非线性的曲线。
在这里插入图片描述
这里用到的激活函数是ReLu,负数为0,正数是它本身,ReLu曲线如下:
在这里插入图片描述
在这里插入图片描述
然后计算出h1的out值。然后以此类推,依次往下传,直到传播到final。

在这里插入图片描述

比如我们这个神经网络是做一个猫狗识别,我们input进去一个图片,然后final出来一个猫或狗的结果。假设猫是1,狗是0。

然后final出来一个值是0.35,那么就是产生了一个误差,我们确定真实值为r,final值为f,然后使用误差函数,我们这里就简单的做误差就是r和f差的绝对值。具体误差函数看工业要求
在这里插入图片描述

后向传播
如果是猫狗检测,得到上述0.35这种非猫非狗的数据,肯定要再来一轮。下一轮经过神经网络的各个节点就需要调整各路的权重了。因为第一轮权重是随机出来的,后续就是要把这些路径的权重训练成所需,比如这里传入猫图片训练成1,传入成狗图片训练成0

在这里插入图片描述
所以我们在经历一轮前向传播之后,要立即接一轮后向传播来改变各路权重。
ps:如果不做后向传播改变各路权重,那么前向传播得到的值会一直不变。

后向传播具体做法:
在这里插入图片描述
等式右侧三个偏导解释分别如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
最后更新w5,新的w5=旧的w5-学习率*刚跟求的偏导
在这里插入图片描述
学习率可以认为是一个步长,如果不设置学习率就相当于学习率是1,对准确率影响较大,一般学习率设为0.01或者其他接近0的数。

在这里插入图片描述

其他的w和前面介绍的w5都是一样的步骤做GD梯度下降,即权重更新。

SGD就是在神经网络中每次随机选一个数据做梯度下降训练。

注:
SGD:随机选一个数据
BGD:全批量数据,比如数据集1000个,每次训练都全部1000个
MBGD:比如数据集1000个,分成几个组,比如分成20组,每组50个。做20轮梯度下降,每次取1组50个出来。

在这里插入图片描述
下面对FedAvg联邦平均算法进行一个具体的解释:
Client:
在这里插入图片描述

Server:
在这里插入图片描述



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/726739.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Linux】—在Linux中搭建Python环境

文章目录 前言一、检查Linux系统是否自带Python版本。二、安装依赖包(重要)三、下载Python-3.9.5安装包四、下载完成后,通过xftp6上传到Linux服务器上五、解压Python安装包六、编译安装Python七、配置Python环境变量八、运行Python,查看是否可用九、pyth…

图像处理与视觉感知复习--频率域图像增强图像变换

文章目录 图像变换与信号分解正弦信号与傅里叶级数傅里叶变换离散傅里叶变换(DFT)频率域滤波 图像变换与信号分解 空间域:就是像素域,在空间域的处理是在像素级的处理,如像素级的叠加。 频率域:任何一个波形都可以分解用多个正弦…

AI交互数字人如何赋能数智教育?

随着AI交互数字人技术的飞速发展,教育领域正经历着前所未有的变革。AI交互数字人为教育领域注入了全新活力,重塑着教学模式,为学生带来沉浸式学习体验。 AI交互数字人在教育领域中,可以应用在: 1、个性化学习教学指导…

APM Profile 在系统可观测体系中的应用

引言 应用程序性能分析(Application Performance Management,APM)是一个广泛的概念,涉及应用程序运行时各种性能指标的监测、诊断和优化。在可观测体系建设中,APM 是保障系统业务运行性能的关键技术,确保用…

递归算法:代码迷宫中的无限探索

✨✨✨学习的道路很枯燥,希望我们能并肩走下来! 目录 前言 一 深入理解递归 二 迭代VS递归 三 递归算法题目解析 3.1 汉诺塔问题 3.2 合并两个有序链表 3.3 反转链表 3.4 两两交换链表中的节点 3.5 Pow(x,n)(快速幂)…

CRMEB-PHP多商户版安装系统配置清单

系统在安装完成之后,需要对系统进行一系列的配置,才能正常使用全部的功能,以下是官方整理的配置清单 平台后台 商户后台

计算机SCI期刊,中科院3区,易过审,专业认可度不错

一、期刊名称 Journal of Cloud Computing-Advances Systems and Applications 二、期刊简介概况 期刊类型:SCI 学科领域:计算机科学 影响因子:4 中科院分区:3区 三、期刊征稿范围 Journal of Cloud Computing:A…

MyBatis 动态 SQL怎么使用?

引言:在现代的软件开发中,数据库操作是任何应用程序的核心部分之一。而在 Java 开发领域,MyBatis 作为一款优秀的持久层框架,以其简洁的配置和强大的灵活性被广泛应用。动态 SQL 允许开发人员根据不同的条件和场景动态地生成和执行…

Flutter 简化线程Isolate的使用

文章目录 前言一、完整代码二、使用示例1、通过lambda启动线程2、获取线程返回值3、线程通信4、结束isolate 总结 前言 flutter的线程是数据独立的,每个线程一般通过sendport来传输数据,这样使得线程调用没那么方便,本文将提供一种支持lambd…

CIRCOS圈图绘制 - circos安装

Circos是绘制圈图的神器,在http://circos.ca/images/页面有很多CIRCOS可视化的示例。 Circos可以在线使用,在线使用时是把表格转为圈图,不过只允许最大75行和75列;做一些简单的示意图会比较好,最后时会介绍下在线的tab…

vue大屏适配方案

前言 开发过大屏的铁汁们应该知道,前期最头疼的就是大屏适配,由于大屏项目需要在市面上不是很常见的显示器上进行展示,所以要根据不同的尺寸进行适配,今天我将为大家分享的我使用的大屏适配方案,话不多说,直…

MySQL Server和Server启动程序(一)

MySQL Server mysqld,也称为MySQL Server,是一个单线程多任务的程序,它在MySQL安装中执行大部分工作。它不会生成额外的进程。MySQL Server管理对包含数据库和表的MySQL数据目录的访问。数据目录也是其他信息(如日志文件和状态文…

Windows Server配置iSCSI,做ESXI共享存储

1:使用一台Windows Server2022主机配置iSCSI,准备给ESXI8.0做共享存储使用。有一些ESXI的功能必须使用共享存储才行,比如HA的功能。 2:登录系统,点击添加角色和功能。 3:之后一路下一步,在选择…

健身器械行业外贸ERP管理降本增效解决方案

随着经济的迅速发展,以及健身锻炼的普及,人们对健身器材的需求量也在大幅度增加。欧美市场增长迅猛,家用健身器材热度飙升,尤其是跑步机、健身单车等轻便型家用健身器材,备受消费者青睐。 出口的主要国家包括&#xf…

Git 和 TortoiseGit 安装和配置(图文详解)

使用git,需要在Windows上需要安装两个软件:1)Git 2)TortoiseGit 若需要,可以下载TortoiseGit汉化语言包。 注意:tortoiseGit是在安装了Git的基础上运行的,所以需要先安装Git,后安装…

智慧校园导航系统:技术驱动下的校园管理与师生体验革新

随着智慧校园建设的不断推进,校园导航系统作为提升校园管理效率、优化师生出行体验的重要工具,正逐渐成为各大高校的标配。本文将重点介绍维小帮智慧校园导航系统,如何通过创新的设计和功能,解决校园导航中的种种难题,…

1分钟带你部署本地Llama3大模型

介绍 LLaMa 3由Meta于2024年4月18日正式发布,这一版本是对先前LLaMa系列的重大升级。新发布的模型包括8B(80亿参数)和70B(700亿参数)两个版本,这两个版本在一系列行业标准基准测试中展示了最先进的性能。 从…

低版本火狐浏览器报错:class is a reserved identifier

低版本火狐浏览器报错:class is a reserved identifier 原因:react-dnd,dnd-core 等node包的相关依赖有过更新,使得在低版本火狐浏览器中不支持 class 解决方法:在使用webpack打包构建时,编译排除node_modu…

7,KQM模块的驱动

1,查资料,查模块的通信接口(单片机和模块之间采用什么方式通信)硬件接口,驱动方式(串口驱动用串口发送接收PC10,PC11) 只用了三个脚:VCC GND T&…

pdf只要前几页,pdf怎么只要前几页

在现代办公和学习环境中,PDF文件已成为我们日常处理信息的重要工具。然而,有时我们并不需要整个PDF文件的内容,而只是其中的几页。那么,如何高效地提取PDF文件中的特定页面呢?本文将为您介绍几种实用的方法。 打开 “ …