FairTune:优化参数高效微调以实现医学图像分析的公平性

paper:https://arxiv.org/abs/2310.05055
code: https://github.com/Raman1121/FairTune

摘要和介绍

人工智能在医疗健康应用中的应用正在迅速增长。然而,人工智能模型一再被证明对不同的人口统计学亚群体表现出不必要的偏见——AI模型在由性别、种族、年龄和社会经济地位等方面处于弱势群体中提供了明显更差的表现。该论文认为深度学习模型在训练集中已经在本质上是公平的,在训练阶段不同群体是公平的(表现出相同的性能),但是因为模型在不同群体的泛化能力不同,导致在测试集和现实中存在不公平(表现出不同的性能),如下图所示。
image.png
本文的方法植根于容量控制(capacity control)的概念,包括在学习过程中引入一种正则化方法,以最小化看不见的数据的偏差。为了实现这个方法,本文选择了预训练/微调框架。首先在image数据集上进行预训练,然后在小规模医疗图像数据集上微调,在微调阶段,随着更新次数的增加,就出现了上图的情况。因此,主要的挑战在于限制模型更新的程度。本文证明了使用参数高效的微调技术,其中包括对网络参数子集的选择性更新,可以导致更公平的泛化。然而,这种方法有一个关键问题:“应该更新哪些参数以实现公平最大化?”为了解决这个问题,本文引入了名为FairTune的框架,旨在搜索最优参数更新mask。本文寻找的mask是,当应用于约束微调过程时,会对验证数据产生高度的公平性。本文的实验结果表明,在各种医学图像基准中,FairTune在公平性方面优于经验风险最小化(ERM)。
本文主要贡献如下: (1)本文直接证实了Zietlow等人(2022年)的猜想,即在泛化过程中会出现偏见(如上图所示)。(2)与现有的公平干预方法相比,本文引入了一种新的公平学习方法,规范学习,以优化测试阶段的公平性(cf:现有的针对训练集公平性的方法)。(3)本文在不同的基准测试中进行的实证发现一致表明,FairTune比ERM可靠地提高了性能。

相关工作

相关工作介绍了三个部分的内容(1)医学模型的公平性是一个复杂的问题。(2)目前公平性干预的方法主要集中于训练集。(3)所有现有的PEFT方法都存在一个核心挑战,即,它们依赖于启发式方法将参数划分为冻结/更新分区。目前的方法并没有提供一个有原则的或有经验的方法来建立最优分区。这变得特别重要,因为理想的PEFT假设,即冻结/更新分区,可能依赖于数据集。例如,与较小的数据集相比,更大的数据集可以容纳更广泛的参数更新,而不会出现过拟合。

方法

公平性度量

给定一个图像x,我们以一种独立于任何敏感属性s(年龄、性别、种族等)的方式来预测其诊断标签y。这样,训练的模型是公平的,不会使任何不利的特定的人口亚组。大多数实验中,本文优化最弱势群体表现的指标。在这种情况下,给出了数据集D上的模型θ的损失函数 L ( D , θ ) \mathcal{L} (\mathcal{D},\theta ) L(D,θ)。假设它可以被数据集D的不同子组s计算为 L ( D s , θ ) \mathcal{L} (\mathcal{D}_s,\theta ) L(Ds,θ)。那么,公平学习的度量标准是 L f a i r = max ⁡ s ∈ S L ( D s , θ ) \mathcal{L}^{fair} = \max_{s \in S} \mathcal{L} (\mathcal{D}_s,\theta ) Lfair=maxsSL(Ds,θ)。还是用其他指标比如公平性差距 max ⁡ s ∈ S L ( D s , θ ) − min ⁡ s ∈ S L ( D s , θ ) \max_{s \in S} \mathcal{L} (\mathcal{D}_s,\theta ) - \min_{s \in S} \mathcal{L} (\mathcal{D}_s,\theta ) maxsSL(Ds,θ)minsSL(Ds,θ)

PARAMETER-EFFICIENT FINE-TUNING

PEFT中,只需要微调参数的一部分 ϕ ⊂ θ \phi \subset \theta ϕθ。PEFT策略可以解释为指定一个稀疏二进制掩码 ω \omega ω,它决定应该更新 θ \theta θ的哪些部分。给定预训练模型的参数 θ 0 \theta_0 θ0和将应用于其值的变化 △ ϕ \bigtriangleup_ \phi ϕ,微调过程可以描述为:
△ ϕ ∗ = arg ⁡ min ⁡ △ ϕ L b a s e ( D t r a i n ; θ 0 + ω ⊙ △ ϕ ) \bigtriangleup_ \phi^* = \arg \min_{\bigtriangleup_ \phi} \mathcal{L}^{base} (\mathcal{D}^{train};\theta _0+\omega \odot \bigtriangleup_ \phi) ϕ=argminϕLbase(Dtrain;θ0+ωϕ)
其中 L b a s e \mathcal{L}^{base} Lbase为损失函数。
不同的PEFT方法本质上对应于二进制掩模 ω \omega ω的稀疏性结构上的不同结构。
然而,有两个关键的突出挑战: (1)最优的PEFT策略(二进制掩码ω)是依赖于数据集的。例如,更稀疏的掩模ω可能适合较小的目标任务,而更密集的掩模可能适合与训练前任务更不同的任务,因此需要更强的适应。(2)最优的PEFT策略可能取决于最终的泛化目标。例如,与传统的总体泛化相比,稀疏掩模ω可能更适合公平泛化。本文提出了一个解决方案,通过引入一个算法来优化掩模ω关于一个公平的泛化目标。

OPTIMISING PEFT FOR FAIRNESS

从一个预先训练的模型 θ 0 \theta_0 θ0开始,和一个数据集 D D D,它分为训练、验证和测试集 D t r a i n , D v a l , D t e s t D_{train},D_{val},D_{test} DtrainDvalDtest。每个数据集 D = ( X , Y , S ) D =(X,Y,S) D=XYS包含一组图像 X X X、标签 Y Y Y和敏感属性元数据 S S S。还为PEFT掩码 ω ∈ Ω ω∈Ω ωΩ定义了一个搜索空间。目标是在进行PEFT学习时找到能导致最佳的公平泛化能力。
**Bi-level Optimization (双层优化,BLO):**本文将问题陈述形式化为一个由一个内环和一个外环组成的双层优化问题。在内环中,使用传统的损失函数 L b a s e L^{base} Lbase和PEFT掩模 ω ω ω对医疗数据集(Dtrain)上的预先训练好的模型进行微调。在外环中,搜索PEFT掩模 ω ω ω,它导致内环在验证集(Dval)上产生最公平的结果,由 L f a i r L^{fair} Lfair测量。可以通过以下公式进行表示:
ω ∗ = arg ⁡ min ⁡ ω L f a i r ( D ; △ ϕ ∗ ) △ ϕ ∗ = arg ⁡ min ⁡ △ ϕ L b a s e ( D t r a i n ; θ 0 + ω ⊙ △ ϕ ) \omega ^* = \arg \min_\omega \mathcal{L} ^{fair}(\mathcal{D} ;\bigtriangleup _\phi ^*) \\ \bigtriangleup _\phi ^*= \arg \min_{\bigtriangleup \phi }\mathcal{L}^{base} (\mathcal{D^{train};\theta _0+\omega \odot \bigtriangleup _\phi } ) ω=argminωLfair(D;ϕ)ϕ=argminϕLbase(Dtrain;θ0+ωϕ)
过程可以用下图表示。在实验中,本文采用了一种混合方法,采用无梯度树结构的Parzen估计器(TPE)并采用连续减半(SH)策略来优化外环的 ω ∗ ω^∗ ω,在外环使用梯度下降算法微调 △ ϕ ∗ \bigtriangleup _\phi^* ϕ
image.png
除了选择性更新掩模ω外,学习率α还提供了一个关于更新量的粗略提示。例如,适当地降低学习速率可以防止图1中所示的最异常的过拟合,算法过程如下所示。
image.png

实验结果

如下图所示
image.png

Limitations

下游公平性性能的提高是以计算为代价的,因为它需要我们尝试二进制掩码的各种配置,每个配置对应于一个模型再训练。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/431220.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【暗月安全】2021年渗透测试全套培训视频

参与培训需要遵守国家法律法规,相关知识只做技术研究,请勿用于违法用途,造成任何后果自负与本人无关。 中华人民共和国网络安全法(2017 年 6 月 1 日起施行) 第二十二条 任何个人和组织不得从事入侵他人网络、干扰他…

数据结构之七大排序

𝙉𝙞𝙘𝙚!!👏🏻‧✧̣̥̇‧✦👏🏻‧✧̣̥̇‧✦ 👏🏻‧✧̣̥̇:Solitary_walk ⸝⋆ ━━━┓ - 个性标签 - :来于“云”的“羽球人”。…

Kubernetes Service

一、Service:Kubernetes 中的服务返现与负载均衡 1、为什么需要服务发现 Pod 生命周期短暂,IP 地址随时变化。 Deployment 等的 Pod 组需要统一访问入口和做负载均衡。 应用间在不同环境部署时保持同样的部署拓扑和访问方式。 2、应用服务如何暴露到…

停止Tomcat服务的方式

运行脚本文件停止 运行Tomcat的bin目录中提供的停止服务的脚本文件 关闭命令 # sh方式 sh shutdown.sh# ./方式 ./shutdown.sh操作步骤 运行结束进程停止 查看Tomcat进程,获得进程id kill进程命令 # 执行命令结束进程 kill -9 65358 操作步骤 注意 kill命令是…

简单的排序算法

目录 1.直接插入排序 2.希尔排序 3.选择排序 4.冒泡排序 5.计数排序 6.排序总结 1.直接插入排序 (1)思想 所谓插入排序,就是将待排序数据插入到已经有序的数据中,为了使插入后数据依然有序,就要选中一个合理的…

android开发网络通信,带你彻底搞懂Android启动速度优化

实现方案 直接依赖 这种方式实现简单,但是耦合太严重,不方便维护与开发,当工程逐渐增大模块逐渐增多,依赖关系会非常复杂,不推荐这种方式。 事件或广播通信 EventBus: 我们非常熟悉的事件总线型的通信框…

JavaScript的`bind`方法:函数的“复制”与“定制”

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 🍚 蓝桥云课签约作者、上架课程《Vue.js 和 E…

jquery选择器有哪些

jQuery是一个功能强大的JavaScript库,它提供了丰富的选择器来帮助开发者更方便地选择和操作DOM元素。以下是jQuery的一些常用选择器及其示例代码: 1.基本选择器: // 通过ID选择元素 $("#myId").css("color", "red…

【论文阅读 VLDB22】On-Demand State Separation for Cloud Data Warehousing

On-Demand State Separation for Cloud Data Warehousing 问题背景 首先是问题背景,目前除了大规模PB级别的AP会使用云数据库,越来越多的百G大小的中小规模的负载也开始进行上云分析和处理,而这些ap任务不需要消耗整个集群的资源&#xff0…

DHCP自动获取IP地址实验(思科)

华为设备参考:DHCP自动获取IP地址实验(华为) 一,实验目的 路由器搭载DHCP,让PC通过DHCP自动获取IP地址 二,不划分vlan 实验拓扑 配置命令 Switch Switch>enable Switch#configure terminal Switch(c…

C#不可识别的数据库格式解决方法

1.检查数据库文件路径和文件名: 确保指定的路径和文件名拼写正确,而且文件确实存在于指定的位置。使用绝对路径或相对路径都是可行的,但要确保路径的正确性 string connectionString "ProviderMicrosoft.ACE.OLEDB.12.0;Data SourceE:…

go 程序被意外kill后出现僵尸进程解决方案

go 管理自身子进程(防止僵尸进程出现) 写这篇文章是因为最近有同事竟然会知道异步启动子进程,不会关闭,最后导致导致僵尸进程出现,而且由于子进程会随着业务的使用越开越多,主进程一旦被kill掉就会不得不手动一个一个kill。 大概…

【车辆安全管理】强制降速系统

在很久之前,我们就讨论过车辆强制降速系统的重要性,即使驾驶人故意撞人,也难以做到,因为强制降速系统会控制车辆的速度。强降速系统可以通过多种传感器进行智能分析,即使降速。 汽车的Robot化概念-CSDN博客 最近发生…

LiveGBS流媒体平台GB/T28181功能-集中录像存储前端设备录像回看解决方案设备录像|云端录像|实时录像说明

LiveGBS集中录像存储前端设备录像回看解决方案设备录像|云端录像|实时录像说明 1、平台概述2、视频录像2.1、设备录像2.1.1、存储位置2.1.1.1、下级硬件设备2.1.1.2、下级国标平台 2.1.2、页面操作2.1.2.1、国标设备2.1.2.1.1、查看通道2.1.2.1.1.1、设备录像 2.1.2.1.2、配置中…

城市平均高温、平均低温数据爬取与可视化

爬取历史天气网站数据 从天气网站爬取指定城市、指定时间范围内的天气数据,并将数据保存为CSV文件。具体而言,它使用了Selenium库来模拟浏览器行为,以便获取动态加载的页面内容。 主要步骤如下: 读取城市信息和代理IP信息&…

Nodejs 第四十九章(lua)

lua Lua是一种轻量级、高效、可嵌入的脚本语言,最初由巴西里约热内卢天主教大学(Pontifical Catholic University of Rio de Janeiro)的一个小团队开发而成。它的名字"Lua"在葡萄牙语中意为"月亮",寓意着Lua…

【QT】 QTreeView/QTreeWidget插入文件目录列表

目录 1 QTreeView插入文件目录列表 1.1 自定义默认展开指定路径及文件 1.2 展开指定路径的所有目录及文件 2 QTreeWidget插入文件目录列表 1 QTreeView插入文件目录列表 显示指定磁盘下的目录,简单的方式就是利用QTreeViewQDirModel就可以显示了。 1.1 自定义默认…

05_Mongooes

Mongooes Mongoose是通过Node来操作MongoDB的一个模块。是基于Node.js的第三方模块。 一、Node.js安装 1.解压 2.创建文件夹 解压路径下,创建两个文件夹 node_global:全局安装位置 node_cache:缓存 3.配置 配置环境变量 在path路径…

Open3D(C++) 指定点数的体素滤波

目录 一、算法原理1、算法过程2、参考文献二、代码实现三、结果展示本文由CSDN点云侠原创,原文链接。如果你不是在点云侠的博客中看到该文章,那么此处便是不要脸的爬虫与GPT。 一、算法原理 1、算法过程 对于数据量较大的点云,在后期进行配准时会影响计算效率。而体素格网…

03. Nginx入门-Nginx虚拟主机

Nginx虚拟主机简介 yum安装与源码安装一样,只是Nginx配置文件路径不一致,这里用的yum安装的配置文件路径。 利用虚拟主机的功能,可以在一台Nginx服务器上部署一个或多个虚拟主机。 虚拟主机主配置文件 注意:配置完成Nginx主配置…