论文解读 | NeurIPS2023:「解释一切」图像概念解释器

点击蓝字

fb6cfac3f7864dde9cb45928a155a1bc.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

1178b470f3e8ee16e31b6e22d10eab07.jpeg

讲者简介

孙奥:

香港科技大学软件安全实验室在读博士,研究兴趣为可解释性人工智能和可信机器学习,主要是从Post-hoc,逻辑和概念的角度分析神经网络的机理

Title


「解释一切」图像概念解释器

Content

内容简介

可解释AI(XAI)是提高人类对深度神经网络(DNN)理解给定黑盒内部的重要主题。对于计算机视觉任务,主流的基于像素的XAI方法通过识别重要像素来解释DNN决策,新兴的基于概念的XAI探索用概念形成解释。然而,像素通常很难解释和敏感XAI方法的不精确性,而先前工作中的“概念”需要人工注释或仅限于预定义的概念集。另一方面,由大规模预训练驱动, Segment Anything Model(SAM)已被证明是执行精确和全面的实例分割的强大且可扩展的框架,从而能够从给定的图像中自动准备概念集。本文首次探索了使用SAM来增强基于概念的XAI。我们提出了一种有效的灵活的基于概念的解释方法,即解释任何概念(EAC),它用任何概念解释DNN决策。虽然SAM非常有效并提供“开箱即用”实例分割,但在集成到事实上的XAI方法中时成本很高。因此,我们提出了一种轻量级的每个输入等效(PIE)方案,从而能够使用代理模型进行有效的解释。我们对两个流行数据集(ImageNet和COCO)的评估说明了EAC相对于常用XAI方法具有更好的性能。

个人主页:
https://jerry00917.github.io

论文链接:
https://openreview.net/pdf?id=X6TBBsz9qi

代码链接:
https://github.com/Jerry00917/samshap

Background

随着深度学习模型的崛起,越来越多的网络被提出,像Resnet、DenseNet等的黑箱模型越来越普遍,并且网络预测的准确率很高,但是其中的可解释性问题仍然是一个难题。

e8b764844176594c804f8c02c81265d9.png


如下图,之前的工作中大致可以分为两类。第一类是SuperPixel-based LIME,它使用超像素来创建图像的局部表示,然后使用LIME来解释与这些超像素相关的机器学习模型的预测结果。这种方法的目标是提高解释性,帮助我们更好地理解模型是如何基于图像的局部特征做出预测的。通过关注图像的关键局部区域,我们可以更清晰地了解模型的决策过程。

第二类是Grad-based GradCam,它指的是使用梯度信息来生成GradCam 图,从而可视化深度学习模型对于给定输入图像中哪些区域产生了影响。这有助于我们理解模型是如何基于输入图像的不同部分作出决策的,特别是关于特定类别的决策。这种方法使我们能够直观地看到模型在图像中关注的重要区域,有助于提高模型的解释性。

c633d98b5cd203a024ed3f44c129660b.png


Motivation

对于第一种方法,如果超像素的尺寸过大,可能会导致不准确但更“完整”,更易于人类理解的输出;反之,对于第二种方法,如果超像素的尺寸过小,可能会导致不准确的输出,但更容易理解。这两种方法的解释都不够人性化,所以,作者希望能够实现一种对人类友好的,也能够高精度预测的方法。

Approach

本文中,作者提出了一种通用且灵活的基于概念的解释方法,即Explain Any Concept(EAC),它可以用任何概念解释模型预测。该方法分为三个阶段:第一阶段,Segmented Image,使用模型SAM将输入图像划分为一组视觉概念;第二阶段,训练一个每个输入等效的(PIE)代理模型来近似目标DNN的行为;第三阶段,使用代理模型通过第一阶段获得的概念有效地解释模型预测。

值得注意的是,在EAC的第二阶段,作者使用Shapley值来识别有助于目标模型预测的关键概念。然而,尽管Shapley值很有效,但是由于其指数复杂性,计算成本很高。所以,作者提出了(PIE)的方案来降低目标模型的复杂性,这可以显著降低Shapely值的计算成本。

501f3fb97f143d3158cd9155836b0709.png


Post-hoc Model Explanation: EAC

如下图是所提方法的效果图,它规避了SuperPixel-based LIME和Grad-based GradCam的缺点,可以将最完整、最准确的内容解释出来,对人类也是十分友好的。

d473a3a04a32c1c6019d337638d270ca.png


Comparison

下图中展示了几个案例,证明了EAC在解释模型预测方面的有效性。我们可以观察到,EAC在解释其他测试用例中的模型预测方面显著优于其他方法。EAC生成了更多“格式良好的”概念级别的解释,而这些解释在下图的案例中都是人类可理解的。例如,在第一种情况下,EAC正确地突出了“训练”作为概念级别的解释,而前三个基线方法会产生一些可忽略的像素、图像的片段(第4、第5和第6个基线)或整个图像(第7个基线)。对比图显著说明了EAC在理解性方面的优势。

bf82fac21e6ef86839c33ccf31f22af8.png


Experiments

该部分通过实验验证了EAC方法的有效性。与其他基线方法的对比结果显示,EAC在不同条件下的效果都要优于其他方法。比如,以ImageNet和CoCO作为数据集,在不同的基线方法中插入或删除新的概念,比较对模型性能的影响,EAC都实现了更高的AUC值,显著优于其他方法。

cc5faef74df19a12655bfba7c0f356af.png

Human-friendly Explanation

本篇工作还进行了有意思的人机交互实验。作者通过随机邀请6位该领域的研究者,以此来投票选出认为对人类最为友好的解释方法。实验显示,EAC在所有baseline中得分最好,能够预测最完整的概念,也更易于人类理解。

b5daff75320524775f7f3096527e9a1e.png

Conclusion

本文提出的框架有两大优势。第一,模型的准确度很高,这可以由上述的Insertion和Deletion实验体现;第二,XAI本质上是需要服务人类的,所以它的输出对人类而言应该是友好的,而本文首次在XAI中提出了一种创新性的人机交互实验,并且所提方法更易于人类理解。

Future Work

本文所提出的EAC方法也可用于解释 DNN 对医学图像的预测,但是目前而言,效果并不够好,这可能会误导医生并导致严重的后果。因此,作者期望在将来能够有更多的研究者专注于该细分领域,实现更加鲁棒的新方法。

整理:陈妍
审核:孙奥

提醒

点击“阅读原文”跳转到01:33:22

可以查看回放哦!

往期精彩文章推荐

f4de7fbe699fd2a1ce274f5c7433e2a0.jpeg

记得关注我们呀!每天都有新知识!

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了1400多位海内外讲者,举办了逾600场活动,超600万人次观看。

106ed7f95922544dd2dad5950cb1c737.png

我知道你

在看

~

364502696231c7f9f78bbef22cc1a493.gif

点击 阅读原文 观看回放!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/249235.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

IntelliJ IDEA 自带的 HTTP Client接口调用插件,替代 Postman

文章目录 引言建议目录结构新建请求不同环境的变量配置添加环境http-client.env.jsonhttp-client.private.env.json引用变量 请求示例Get请求示例Post请求示例鉴权示例断言示例Websocket请求示例 内置对象和动态变量内置对象:内置变量: 引言 在日常的 W…

Eslint 要被 Oxlint替换了吗

什么是 Oxlint 由于最近的rust在前端领域的崛起,基于rust的前端生态链遭到rust底层重构,最近又爆出OxLint,是一款基于Rust的linter工具。Oxlint在国外前端圈引起热烈讨论,很多大佬给出了高度评价。 事实上,Oxlint 是 Oxc 项目旗下的一款产品,专为 JavaScript 和 TypeSc…

Python轴承故障诊断 (七)基于EMD-CNN-LSTM的故障分类

目录 前言 1 经验模态分解EMD的Python示例 2 轴承故障数据的预处理 2.1 导入数据 2.2 制作数据集和对应标签 2.3 故障数据的EMD分解可视化 2.4 故障数据的EMD分解预处理 3 基于EMD-CNN-LSTM的轴承故障诊断分类 3.1 训练数据、测试数据分组,数据分batch 3.…

TG-5510cb: txo高稳定性+105℃高温

TG-5510CB是一款高稳定性TCXO,可提供CMOS或限幅正弦输出,5G基站和边缘计算的额定温度为85C,需要室外安装、小型化和无风扇运行。与其他TCXO相比,实验室提供了许多改进,如低温度斜率和相位噪声。符合GR-1244-CORE地层3和…

ssm+vue的高校智能培训管理系统分析与设计(有报告)。Javaee项目,ssm vue前后端分离项目。

演示视频: ssmvue的高校智能培训管理系统分析与设计(有报告)。Javaee项目,ssm vue前后端分离项目。 项目介绍: 采用M(model)V(view)C(controller&#xff09…

git 常见错误总结(会不断更新中。。)

常见错误 1. 配置部署key后git clone还是拉不下代码 执行以下命令 先添加 SSH 密钥到 SSH 代理: 如果你使用 SSH 代理(例如 ssh-agent),将生成的私钥添加到代理中。 ssh-add ~/.ssh/gstplatrontend/id_rsa如果报错以下错误信息…

centos7下用yum安装包出现问题

原因: 这是因为yum采用Python作为命令解释器,这可以从/usr/bin/yum文件中第一行#!/usr/bin/python发现。而python版本之间兼容性不太好,使得2.X版本与3.0版本之间存在语法不一致问题。而CentOS 7自带的yum采用的是python2.7,当系…

3. cgal 示例 GIS (Geographic Information System)

GIS (Geographic Information System) 地理信息系统 原文地址: https://doc.cgal.org/latest/Manual/tuto_gis.html GIS 应用中使用的许多传感器(例如激光雷达)都会生成密集的点云。此类应用程序通常利用更先进的数据结构:例如,不…

车载以太网笔记

文章目录 以太网协议分层协议中间设备子网掩码物理层测试内容比较杂,后续会整理。 以太网协议分层 协议 中间设备

Github 2023-12-16开源项目日报Top10

根据Github Trendings的统计,今日(2023-12-16统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Python项目2非开发语言项目2TypeScript项目1Jupyter Notebook项目1Go项目1PHP项目1JavaScript项目1C#项目1 精…

初识Dubbo学习,一文掌握Dubbo基础知识文集(1)

🏆作者简介,普修罗双战士,一直追求不断学习和成长,在技术的道路上持续探索和实践。 🏆多年互联网行业从业经验,历任核心研发工程师,项目技术负责人。 🎉欢迎 👍点赞✍评论…

verilog进阶语法-触发器原语

概述: xilinx设计的触发器提供了多种配置方式,方便设计最简触发器,同步复位触发器,异步复位触发器,同步时钟使能触发器,异步时钟使能触发器。输出又分为同步复位和置位,异步清零和预置位。 官方提供的原语…

抖音视频解析,无水印解析下载抖音视频

抖音视频解析,你是否经常遇到这样的情况,看到一些非常精彩的抖音视频,想要保存下来,但因为下载速度慢或者视频带有水印而感到困扰?那么,这款(抖音无水印解析工具)将是你的得力助手&a…

离散域下内置式永磁同步电机复矢量电流调节器设计

导读:本期文章主要介绍离散域下内置式永磁同步电机复矢量电流调节器的设计。通过与传统的线性PI调节器仿真验证分析,离散域下设计的电流调节器削弱了d、q之间耦合的影响,大大提高了系统的控制性能。 如需要文中的仿真模型,关注微信公众号:浅谈电机控制,留言获取。 一、…

股票交易信息实时大屏(Kafka+storm+Redis+DataV)

目录 引言 需求分析: 思路 数据源: 数据传输: 数据处理: 数据统计: 数据可视化: 数据提取: 技术栈 技术实现 前端界面搭建 布局: ​ 组件: 通信&#x…

免费下载6G全国90米高程DEM

这里为大家分享全国90米高程原始数据。 全国90米高程DEM 90米高程数据的经纬度跨度有按30度进行分块和按5度进行分块两种,下载完成后的文件如下图所示。 30度分块与5度分块 当经纬度跨度按30度进行分块时,全国范围共分成6块,由于分块的跨度…

【网络安全】网络防护之旅 - 非对称密钥体制的解密挑战

🌈个人主页:Sarapines Programmer🔥 系列专栏:《网络安全之道 | 数字征程》⏰墨香寄清辞:千里传信如电光,密码奥妙似仙方。 挑战黑暗剑拔弩张,网络战场誓守长。 目录 😈1. 初识网络安…

KMP算法, 什么是KMP算法 ,暴力匹配 ,KMP算法实现

文章目录 KMP算法什么是KMP算法暴力匹配KMP算法实现 KMP算法 什么是KMP算法 KMP是Knuth、Morris和Pratt首字母的缩写,KMP也是由这三位学者发明(1977年联合发表论文)。 KMP主要应用在字符串的匹配,是一个解决模式串在文本串是否…

基于单片机的太阳能数据采集系统(论文+源码)

1. 系统设计 在本次太阳能数据采集系统的设计中,以AT89C52单片机为主要核心,主要是由LCD液晶显示模块、存储模块、温度检测模块、串口通信模块,光照检测模块等组成,其实现了对太阳能板的温度,光照强度的检测和记录&…

在 App 设计工具的设计视图中布局 App

目录 自定义组件 对齐和间隔组件 组件分组 对组件重新排序 修改组件的 Tab 键焦点切换顺序 在容器中排列组件 在 App 设计工具中创建和编辑上下文菜单 创建上下文菜单 编辑上下文菜单 更改上下文菜单分配 App 设计工具中的设计视图提供了丰富的布局工具,用…