SHAP 和 LIME 解释模型

内容大纲

  • 1、SHAP 解释器
    • 1.1 案例:用于预测患者肺癌
    • 1.2 案例中使用的shap解释器
    • 1.3 SHAP工作原理
    • 1.4 举例说明
  • 2、LIME 解释器
    • 2.1 案例:判断法律案件胜诉可能性
    • 2.2 LIME解释器工作原理
    • 2.3 本地解释模型的训练过程
    • 2.4 举例说明1:新闻分类
    • 2.4 举例说明2:电影评论判断

1、SHAP 解释器

1.1 案例:用于预测患者肺癌

该案例使用肺癌数据集,使用随机森林分类器训练模型,并预测测试集标签。最后使用SHAP解释器解释模型预测的依据,如哪些特征对预测影响较大,此外也可以添加其他指标评估模型质量。

1.2 案例中使用的shap解释器

  • SHAP基于 shapely 值理论,它源于博弈论,用于衡量个体特征对模型预测结果的贡献。
  • 对于每一个样本,SHAP通过计算该样本所有可能子集中,特征存在与不存在时模型输出的差异。
  • 这些边际贡献根据公式计算出代表该特征对该实例预测结果贡献的shapley值。
  • 由于shapley值具有加性性质,可以计算出每一个特征在该实例中的绝对影响程度。
  • SHAP解释器会对每一次预测计算所有特征的shapley值。
  • 这些shapley值既可以用来解释单个预测,也可以汇总 stationed 的 shapley值对所有样本进行可视化。
  • 例如平均按特征 shapley值排序可以看出影响程度最大的特征。
  • SHAP值也可以利用依赖图等方式展示特征间相互影响。

1.3 SHAP工作原理

假设我们有一个分类模型,输入有3个特征A,B,C,输出一个标签0或1。

现在有一个样本,其特征值为:

  • A = 1
  • B = 0
  • C = 1
    模型给出的预测标签是1

1、SHAP解释器会计算:

  • 当只有A时,模型预测值。
  • 当只有B时,模型预测值。
  • 当只有C时,模型预测值。
  • 当A,B共存时,模型预测值。
  • 当A,C共存时,模型预测值。
  • 当B,C共存时,模型预测值。
  • 当A,B,C全存在时,模型预测值。

2、它通过对比不同子集中模型输出的差异,来计算每个特征的边际效应
3、然后根据shapley值公式,得到每个特征A,B,C对预测结果的独立贡献,也就是它们的SHAP值。
4、通过这样的分析,我们就可以看到每个特征对预测结果的影响程度,这就是SHAP解释器工作的基本套路。

SHAP解释器计算每个特征的边际效应是基于下面这个思路:
对于样本X上的模型预测f(X),它有m个特征。
对于每个特征xi, SHAP会考虑该特征在所有可能的子集S中的取值:

  • 当xi在S中时,模型输出为f(X|S)
  • 当xi不在S中时,模型输出为f(X|-xi)

那么这个特征xi在子集S中的边际效应定义为: 边际效应 = f(X|S) - f(X|-xi)
也就是说,这个特征加入或去除子集S时,模型输出的变化。

5、SHAP会计算样本X上每个可能的子集S,然后对每个特征xi统计他在所有子集S中的边际效应。

6、最后根据shapley值的定义,通过加权平均计算出特征xi对整体模型输出f(X)的贡献大小。

这个贡献量就是我们常说的这个特征的SHAP值,就代表了它对预测结果的独立影响程度。

所以通过不断采样不同子集,SHAP可以详细解剖每个特征的边际影响,从而给出它们对结果的解释。

1.4 举例说明

小明,小军,小强,组队参加王者农药大赛,大赛设定哪个队先拿100个人头可获得一万元奖金。终于在他们三个的通力配合下,赢得了比赛获得一万元奖金,但分钱阶段出现了分歧,因为三个人的水平、角色不一,小强个人实力最强善用高输出角色,光是他自己就拿了大半的人头;但若是按照人头数分,也不合适,因为前期小强有几次差点挂掉,多亏队友及时治疗,另外有好多人头也是靠攻速抢到的。如何分配这一万元最公平?

这个问题,我们可以从贡献出发:

  • 小强自己可以干掉35个人,小军可以干掉15个人,小明可以干掉10个人,显然,他们每个人都无法独立完成目标。
  • 小强和小军联手可以干掉70个人,小强和小明可以干掉60个人,小军和小明联手可以干掉40个人,同样,无法完成任务。
  • 而只有当三个人联手时候,才可以干掉100个人,达成目标。

考虑先后顺序,他们三个人一共有6种组队方式。

我们定义边际贡献:假定初始组合为小强一个人,贡献35,加入小军后,他们俩的组合贡献为70,则小军的边际贡献就是70-35=35,再加入小明,三个人的组合贡献为100,则小明的边际贡献为100-70=30;

根据组合次序计算全部的组合及组合中每个人的边际贡献,如表格所示,则可以求得每个人的贡献度。
在这里插入图片描述
因此,最合理的分配方案就是小强小军小明分别获得4916、2917、2167。

【举例参考原文:https://zhuanlan.zhihu.com/p/106320452】

2、LIME 解释器

2.1 案例:判断法律案件胜诉可能性

该案例加载法律案件数据,训练RF分类模型预测胜诉可能性,并使用LIME解释单例预测依据,可以辅助法律工作。

2.2 LIME解释器工作原理

LIME(Local Interpretable Model-agnostic Explanations) 的工作原理:

  • 对预测的每个样本,LIME都会训练一个"本地解释模型"来近似实际模型在这个样本附近的行为。
  • 本地解释模型一般使用线性模型或者决策树这类易解释模型。
  • LIME通过对样本附近数据点进行扰动,并询问实际模型得到这些点的预测,来训练本地模型。
  • 本地模型可以解释实际模型对这个样本的预测是如何受不同特征值影响的。

所以LIME可以解释模型预测一个单独样本的原因,指出影响程度最大的特征,这对法律工作很有意义。它的优点是模型无关,仍适用于黑箱模型,这就是LIME受到欢迎的原因。

2.3 本地解释模型的训练过程

LIME训练本地解释模型的过程包括以下步骤:

  1. LIME周围采样许多实例,如更改、删除单个词等。这构成了一个新数据集。
  2. 对新数据集每个实例,询问原始模型给出的预测结果。这为新数据集加入预测标签。
  3. LIME对新数据集中的每个实例计算其相对于原始实例的距离作为新特征。
  4. LIME利用新数据集训练一个线性回归模型,取各个特征项的系数作为“影响程度”。
  5. 被训练的线性模型直接优化的是对原始模型在周围实例表现的模拟goodness。
  6. 其中的特征系数量化了不同特征值改变对原始模型输出影响的程度。
  7. 系数值越大,表示该特征对原始模型输出贡献越大,可以视为关键影响特征。

通过这一训练过程,LIME得到的线性模型仅在原始样本附近有效,但能反映原始模型在这里的线性表现,从而提供本地解释。

2.4 举例说明1:新闻分类

假设我们有一个文本分类模型,用于判断新闻文章是否为政治类。

给定一个测试样本:
文本内容: “政府宣布将提高税率。”
模型预测: 政治类

LIME会做如下工作:

  1. 创建样本的变异实例,如删改单个单词:
  • “政府宣布税率。”
  • “将提高税率。”
  • “政府将提高。”
  1. 询问原模型这些实例的预测结果。

  2. 求每个实例与原样本的距离,做为新特征。

  3. 用这些新数据训练线性模型fitting原模型表现。

  4. 得到的线性模型公式为:
    y = 1.0*“政府” + 0.8*“税率” + 0.1*“将提高”

所以关键词为"政府"和"税率",它们最大影响预测结果。

通过这个例子可以清楚看到LIME是如何在本地近似原始模型,并解释单个预测结果的。它利用了简单且易解释的线性模型。

2.4 举例说明2:电影评论判断

假设我们有一个模型来判断是否是正面评论,输入是一个短评文本:

评论文本: “电影很好看,主演演技饱满”
模型预测: 正面评论

LIME会做以下工作:

  1. 根据输入文本生成多种扰动样本,如删除个别单词
  2. 检查样本:“电影很演技饱满”
    模型预测:负面评论
  3. 样本:“主演演技饱满”
    模型预测:中性评论
  4. 将样本和预测作为新数据集训练线性模型
  5. 得到线性模型:
    正面=1.0*“电影很好看”+0.6*“主演演技饱满”
  6. 所以"电影很好看"对正面判断贡献最大

通过对原始样本进行简单删除操作,LIME找到主要影响项"电影很好看",表明它是模型判断的关键依据。

————————————————
原文链接:https://blog.csdn.net/weixin_71458119/article/details/132460672

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/120946.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

智慧安防:监控防盗两不误的安防视频监控系统是什么样的?

随着社会的不断发展,安全问题越来越受到人们的关注,特别是对于居住在城市里的人们来说,盗窃问题是影响他们生活质量的重要因素之一。因此,根据市场需求,以监控防盗两不误的智慧监控系统得到了广泛的推广和应用。 一般…

长春理工大学漏洞报送证书

获取来源:edusrc(教育漏洞报告平台) url:主页 | 教育漏洞报告平台 兑换价格:10金币 获取条件:提交长春理工大学任意中危或以上级别漏洞

删除word最后一页之后的空白页

最近编辑word比较多,有时最后一页(最后一页内容还有可能是表格)之后,还有一页空白页,单独按下backspace、del都删不掉,很让人着急。 经过查询有几种方法: (1)点击选中空…

rviz中引入SW的模型

一、SW装配图转urdf 参考链接:https://blog.csdn.net/weixin_45168199/article/details/105755388 这部分直接看参考链接就可以,主要思路如下 1、把sw中的零散零件按照机器人中连杆的分类整合成几个大零件 2、把几个大零件整合成装配体,并…

合肥工业大学数字逻辑实验三

** 数字逻辑 实验报告** ✅作者简介:CSDN内容合伙人、信息安全专业在校大学生🏆 🔥系列专栏 :hfut实验课设 📃新人博主 :欢迎点赞收藏关注,会回访! 💬舞台再大,你不上台,永远是个观众。平台再好,你不参与,永远是局外人。能力再大,你不行动,只能看别人成功!…

AIGPT重大升级,界面重新设计,功能更加饱满,用户体验升级

AIGPT AIGPT是一款功能强大的人工智能技术处理软件,不但拥有其他模型处理文本认知的能力还有AI绘画模型、拥有自身的插件库。 我们都知道使用ChatGPT是需要账号以及使用魔法的,实现其中的某一项对我们一般的初学者来说都是一次巨大的挑战,但…

JavaScript从入门到精通系列第三十一篇:详解JavaScript中的字符串和正则表达式相关的方法

文章目录 知识回顾 1:概念回顾 2:正则表达式字面量 一:字符串中正则表达式方法 1:split 2:search 3:match 4:replace 大神链接:作者有幸结识技术大神孙哥为好友,…

智能网联汽车有哪些信息安全场景

目录 1.车内安全通信 2.车云安全通信 3.安全启动 4.车载应用程序保护 5.入侵检测防御与日志管理系统 在聊完车载信息安全需求之后,势必要去看看​应用场景有哪些。根据之前的开发经验简单聊一下我知道的,还有很多没有讲,比如说车云之间具…

【QT】 Qt自定义ui控件

在使用Qt的ui设计时,Qt为我们提供了标准的窗口控件,但是在很多复杂工程中,标准窗口控件并不能满足所有的需求,这时就需要我们自定义控件。我们自定义的类既可以作为独立的窗口显示,又可以作为一个控件显示。 我们要实现…

MySQL 8.0 Clone 备份恢复演练

文章目录 前言1. 恢复目标2. 环境说明3. 克隆数据4. 恢复全量数据5. 注册增量日志6. 应用增量日志 后记 前言 上一篇文章中,我们介绍了使用 Clone 插件进行备份,相关的恢复流程将在本篇文章介绍。 MySQL 8.0 Clone Plugin 详解 恢复增量数据的方法&…

同创永益与国泰君安证券签署全面战略合作协议

10月24日,“生态赋能 智绘未来”国泰君安2023年金融科技文化节主题论坛召开,同创永益董事长朱柯、副总裁朱晓岚受邀出席活动,并与国泰君安总裁王松、首席信息官俞枫共同签署战略合作协议。双方将围绕产业研究、技术创新、人才培养等多方面方面…

Microsoft Dynamics 365 CE 扩展定制 - 7. 安全

在本章中,我们将介绍以下内容: 构建累积安全角色配置业务单元层次结构基于分层位置配置访问配置和分配字段级安全组建团队并共享设置访问团队对静止数据进行加密以满足FIPS 140-2标准管理Dynamics 365在线SQLTDE加密密钥简介 Dynamics 365是一个强大的平台,具有超过10年的良…

02-PostgreSQL的基本使用

一、数据库操作 ①: 登录到数据库 psql -U postgres -d postgres -h 127.0.0.1②:查看所有数据库 \l③: 创建数据库 # 创建一个名为 mydb 的数据库 create database mydb;④:切换数据库 # \c 数据库名 \c mydb⑤:删除数据库 # 删除前 先确保数据库没有被连接 drop databa…

黑色星期五推广策略:TikTok海外网红营销加速品牌增长

在数字化时代,TikTok已经成为了一个具有巨大潜力的社交媒体平台,它不仅让用户分享短视频,还为品牌提供了一个独特的宣传渠道。尤其是在黑色星期五这个全球购物盛宴的时刻,品牌有机会通过TikTok网红营销来提升销售额。本文Nox聚星将…

Linux学习笔记--高级

Shell概述 1,shell概述 是一个c语言编写的脚本语言,是linux和用户的桥梁,用户输入命令交给shell处理。shell,将相应的操作传递给内核(kernel),内核把处理的结果输出给用户 1.1Shell解释器有哪…

CSS 下拉菜单、提示工具、图片廊、计数器

一、CSS 下拉菜单&#xff1a; CSS下拉菜单用于创建一个鼠标移动上去后显示下拉菜单的效果。示例&#xff1a; <style> .dropdown { position: relative; display: inline-block; } .dropdown-content { display: none; position: absolute; background-color: #f9f…

shopee、亚马逊卖家如何安全给自己店铺测评?稳定测评环境是关键

大家都知道通过测评可以提升产品的转化率&#xff0c;提升产品的销量&#xff0c;那么做跨境平台的卖家如何安全的给自己店铺测评呢&#xff1f; 无论是亚马逊、拼多多Temu、shopee、Lazada、wish、速卖通、敦煌网、Wayfair、雅虎、eBay、Newegg、乐天、美客多、阿里国际、沃尔…

研发管理用什么软件?

研发管理用什么软件 研发管理用的软件有&#xff1a;1、JIRA&#xff1b;2、Confluence&#xff1b;3、彩虹PDM软件。彩虹PDM软件 是由南宁市二零二五科技有限公司 自主研发&#xff0c;为用户提供“产品全生命周期管理解决方案”。产品结构管理、BOD管理、零部件管理、工艺管理…

时间序列预测:深度学习、机器学习、融合模型、创新模型实战案例(附代码+数据集+原理介绍)

本文介绍->给大家推荐一下我的时间序列预测专栏&#xff0c;本专栏平均质量分98分&#xff0c;而且本专栏目前免费阅读&#xff0c;其中涉及机器学习、深度学习、融合模型、个人创新模型、数据分析等一系列有关时间序列的专栏&#xff0c;其中的实战的案例不仅有简单的模型类…

宝塔部署QQ机器人,提示OpenSSL 1.0.2k-fips 26 Jan 2017

1、报错预览 Traceback (most recent call last):File "/www/wwwroot/python/bot-one/main.py", line 5, in <module>import requestsFile "/www/wwwroot/python/bot-one/343ae0eb0d491a10a1a00c0621b03ed0_venv/lib/python3.9/site-packages/requests/_…