arxiv2022,没找到是哪个刊物的,是没投中吗? 这篇是用GAN做数据生成,每个client都训练一个生成器,加噪声传到server端聚合,实验是衡量生成图片的质量。
论文地址:arxiv
code:没找到
贡献
提出了提出了一种新颖的方法(FedSyn ),将联邦学习、使用 GAN的合成数据生成和差分隐私(向模型参数添加拉普拉斯噪声)结合为一个框架。
算法流程
和FL的区别是任务不一样了,原来client的分类任务变成了数据生成任务,通讯的分类模型也变成了GAN模型,模型传输时还加上了噪声。
GAN
这一部分是用GAN训练出本地生成器。与传统的GAN一样,由判别器和生成器组成,判别器依旧是输出 真/假 二值,生成器由噪声生成图像。文章还把网络结构图贴了出来(不过GAN易崩溃的问题在这里没说,估计复现出文中效果很困难)。
Differential Privacy
这部分就是加噪声,在传输前和聚合时都加上了拉普拉斯噪声。其中 w 是本地生成器参数, p 是规模参数,L是拉普拉斯噪声。
与高斯噪声相比,使用拉普拉斯噪声优于高斯噪声所得模型参数在数量上失真较小。拉普拉斯噪声的隐私保证也更好。
疑问
-
实验部分展示了生成器的效果,在mnist上面看起来还是不错的,也验证了不同拉普拉斯噪声系数取值时候的影响,但是估计在复杂图像上不太行。。
-
实验时候的数据分割,同一类别的数据都放在一起了,这种数据异构?不是很符合场景。
-
代码啊代码,之后看看其他生成的文章再复现这个吧