利用SHAP算法解释BERT模型的输出

阿航的博客

已于 2024-06-24 10:31:14 修改

阅读量1.3k

点赞数 15

CC 4.0 BY-SA版权

分类专栏：笔记文章标签：算法 SHAP BERT 可解释性

于 2024-06-24 10:17:13 首次发布

本文链接：https://blog.csdn.net/qq_42052733/article/details/139916897

1 何为SHAP?

传统的 feature importance 只告诉哪个特征重要，但并不清楚该特征如何影响预测结果。SHAP 算法的最大优势是能反应每一个样本中特征的影响力，且可表现出影响的正负性。SHAP算法的主要思想为：控制变量法，如果某个特征出现或不出现，直接影响分类结果，那么该特征一定是比较重要的。因此，可以通过计算该特征出现或不出现的各种情况，来计算其对于分类结果的贡献度。在 SHAP 算法中用沙普利（Shapley ）值表示不同特征对于预测结果的贡献度。Shapley 值是博弈论中使用的一种方法，它涉及公平地将收益和成本分配给在联盟中工作的行动者，由于每个行动者对联盟的贡献是不同的，Shapley 值保证每个行动者根据贡献的多少获得公平的份额。

2 代码实现

接下来展示如何用 SHAP 来解释基于 BERT 的文本分类任务，直接从 SHAP官网上扒下来代码：

import nlp
import numpy as np
import scipy as sp
import torch
import transformers
from transformers import BertTokenizer, BertForSequenceClassification
import shap

# load a BERT sentiment analysis model
tokenizer = transformers.DistilBertTokenizerFast.from_pretrained(
    "distilbert-base-uncased"
)
model = transformers