SHAP 和 LIME 解释模型

内容大纲

1、SHAP 解释器
- 1.1 案例：用于预测患者肺癌
- 1.2 案例中使用的shap解释器
- 1.3 SHAP工作原理
- 1.4 举例说明
2、LIME 解释器
- 2.1 案例：判断法律案件胜诉可能性
- 2.2 LIME解释器工作原理
- 2.3 本地解释模型的训练过程
- 2.4 举例说明1：新闻分类
- 2.4 举例说明2：电影评论判断

1、SHAP 解释器

1.1 案例：用于预测患者肺癌

该案例使用肺癌数据集,使用随机森林分类器训练模型,并预测测试集标签。最后使用SHAP解释器解释模型预测的依据,如哪些特征对预测影响较大，此外也可以添加其他指标评估模型质量。

1.2 案例中使用的shap解释器

SHAP基于 shapely 值理论,它源于博弈论,用于衡量个体特征对模型预测结果的贡献。
对于每一个样本,SHAP通过计算该样本所有可能子集中,特征存在与不存在时模型输出的差异。
这些边际贡献根据公式计算出代表该特征对该实例预测结果贡献的shapley值。
由于shapley值具有加性性质,可以计算出每一个特征在该实例中的绝对影响程度。
SHAP解释器会对每一次预测计算所有特征的shapley值。
这些shapley值既可以用来解释单个预测,也可以汇总 stationed 的 shapley值对所有样本进行可视化。
例如平均按特征 shapley值排序可以看出影响程度最大的特征。
SHAP值也可以利用依赖图等方式展示特征间相互影响。

1.3 SHAP工作原理

假设我们有一个分类模型,输入有3个特征A,B,C,输出一个标签0或1。

现在有一个样本,其特征值为:

A = 1
B = 0
C = 1
模型给出的预测标签是1

1、SHAP解释器会计算:

当只有A时,模型预测值。
当只有B时,模型预测值。
当只有C时,模型预测值。
当A,B共存时,模型预测值。
当A,C共存时,模型预测值。
当B,C共存时,模型预测值。
当A,B,C全存在时,模型预测值。

2、它通过对比不同子集中模型输出的差异,来计算每个特征的边际效应。
3、然后根据shapley值公式,得到每个特征A,B,C对预测结果的独立贡献,也就是它们的SHAP值。
4、通过这样的分析,我们就可以看到每个特征对预测结果的影响程度,这就是SHAP解释器工作的基本套路。

SHAP解释器计算每个特征的边际效应是基于下面这个思路:
对于样本X上的模型预测f(X),它有m个特征。
对于每个特征xi, SHAP会考虑该特征在所有可能的子集S中的取值:

当xi在S中时,模型输出为f(X|S)
当xi不在S中时,模型输出为f(X|-xi)

那么这个特征xi在子集S中的边际效应定义为: 边际效应 = f(X|S) - f(X|-xi)
也就是说,这个特征加入或去除子集S时,模型输出的变化。

5、SHAP会计算样本X上每个可能的子集S,然后对每个特征xi统计他在所有子集S中的边际效应。

6、最后根据shapley值的定义,通过加权平均计算出特征xi对整体模型输出f(X)的贡献大小。

这个贡献量就是我们常说的这个特征的SHAP值,就代表了它对预测结果的独立影响程度。

所以通过不断采样不同子集,SHAP可以详细解剖每个特征的边际影响,从而给出它们对结果的解释。

1.4 举例说明

小明，小军，小强，组队参加王者农药大赛，大赛设定哪个队先拿100个人头可获得一万元奖金。终于在他们三个的通力配合下，赢得了比赛获得一万元奖金，但分钱阶段出现了分歧，因为三个人的水平、角色不一，小强个人实力最强善用高输出角色，光是他自己就拿了大半的人头；但若是按照人头数分，也不合适，因为前期小强有几次差点挂掉，多亏队友及时治疗，另外有好多人头也是靠攻速抢到的。如何分配这一万元最公平？

这个问题，我们可以从贡献出发：