从对比解释到溯因解释,再回到对比解释
立即解锁
发布时间: 2025-08-20 00:33:16 阅读量: 1 订阅数: 5 

# 从对比解释到溯因解释,再回到对比解释
## 1. 引言
在机器学习领域,为模型的预测结果提供解释至关重要,这一领域的研究也在迅速增长。可解释人工智能(XAI)的重要性从众多的调查和综述中可见一斑。
过去,计算解释的工作大多关注局部(或依赖于实例)的解释,也有一些方法寻求全局(或独立于实例)的解释。此外,先前的研究主要考虑模型无关的解释,而近期基于模型的解释工作则认为局部(或全局)的模型无关解释是启发式的,因为这些方法对底层机器学习模型没有形式上的保证。
机器学习模型解释的分类如下表所示:
| 实例相关 | 依赖实例 | 独立实例 |
| --- | --- | --- |
| 模型无关 | 启发式局部解释,如 SHAP、LIME、Anchor 等 | 启发式全局解释,如 SHAP、LIME(如子模块选择) |
| 基于模型 | 严格的局部解释 | 严格的全局解释,如绝对/全局 AXps |
大多数计算解释的工作旨在回答“为什么预测是 π?”的问题。一些工作通过线性模型来近似机器学习模型的行为,而其他工作则试图找到一组(通常是最小的)特征值对,这些特征值对足以保证预测结果不变。对于严格的方法,“为什么预测是 π?”问题的答案被称为 PI 解释、溯因解释或(最小)充分理由。
近期的研究还探讨了另一种解释维度,即“为什么预测是 π?”和“为什么预测是 π 而不是 δ?”这两类问题的解释差异。对于“为什么不?”问题的解释被称为对比解释,它隔离了溯因解释所缺乏的实用成分。
本文聚焦于局部溯因解释和对比解释之间的关系。我们的贡献之一是展示了如何利用近期计算严格溯因解释的方法来计算对比解释。此外,我们证明了严格的(基于模型的)局部溯因解释和对比解释之间存在最小击中集关系,这一关系揭示了许多计算和枚举对比解释与溯因解释的新算法。
## 2. 预备知识
### 2.1 机器学习中的可解释性
假设存在一个机器学习模型 M,它由一组有限的一阶逻辑(FOL)句子 M 表示。同时假设存在一组特征 F = {f1, ..., fL},每个特征 fi 是分类(或有序)的,其取值来自某个集合 Di。一个实例是对特征的赋值,实例空间由 F = D1 × D2 × ... × DL 定义。对于实值特征,需要先进行适当的区间离散化预处理。
一个(特征)文字 λi 的形式为 (fi = vi),其中 vi ∈ Di。文字可以被视为原子,即它可以取真或假值。因此,一个实例可以被视为一组 L 个文字,每个文字代表一个不同的特征。一组文字是一致的,如果它在每个特征上最多包含一个文字。一致的文字集可以被解释为文字的合取或析取。
假设存在一个分类问题,类别集合为 K = {κ1, ..., κM}。每个实例 X ∈ F 都有一个预测 π ∈ K。定义一个谓词 M ⊆ F × K,使得 M(X, π) 为真当且仅当输入 X 与给定机器学习模型 M 的预测 π 一致。为了简化表示,使用 Mπ(X) 来表示具体预测 π 的谓词 M(X, π)。
还需要计算 Mπ 的素蕴含项。一个一致的特征文字合取 τ 是 Mπ 的蕴含项,如果以下 FOL 语句为真:
∀(X ∈ F).τ(X) → M(X, π)
记为 τ ⊨ Mπ。类似地,一个一致的特征文字集 ν 是 Mπ 的蕴含式的否定,如果以下 FOL 语句为真:
∀(X ∈ F).ν(X) → (∨ρ≠π M(X, ρ))
记为 Mπ ⊨ ¬ν,或者等价地 (ν ⊨ ¬Mπ) ≡ (ν ⊨ ∨ρ≠π Mρ)。如果蕴含项 τ(或蕴含式 ν)的任何真子集 τ' ⊊ τ(或 ν' ⊊ ν)都不是蕴含项(或蕴含式),则称 τ(或 ν)为素的。
溯因解释表示与某个预测类 π 相关的决策函数的素蕴含项。
### 2.2 不一致公式的分析
本文关注不一致(或不可满足)的公式 F,即 F ⊨ ⊥,这些公式表示为子句的合取。F 中的一些子句可以被放松(即允许不被满足)以恢复一致性,而其他子句则不能。因此,假设 F 被划分为两个一阶子公式 F = B ∪ R,其中 R 包含可放松的子句,B 包含不可放松的子句。B 可以被视为(一致的)背景知识,必须始终被满足。
定义 1(最小不可满足子集(MUS)):设 F = B ∪ R 表示一个不一致的子句集(F ⊨ ⊥)。U ⊆ R 是一个最小不可满足子集(MUS),当且仅当 B ∪ U ⊨ ⊥ 且对于所有 U' ⊊ U,B ∪ U' ⊭ ⊥。
非正式地说,MUS 提供了需要添加到背景知识 B 中以获得不一致性的最小信息,它解释了不一致性的原因。
定义 2(最小修正子集(MCS)):设 F = B ∪ R 表示一个不一致的子句集(F ⊨ ⊥)。T ⊆ R 是一个最小修正子集(MCS),当且仅当 B ∪ R \ T ⊭ ⊥ 且对于所有 T' ⊊ T,B ∪ R \ T' ⊨ ⊥。
在推理不一致子句集时,一个基本结果是 MUS 和 MCS 之间的最小击中集(MHS)对偶关系:MCS 是 MUS 的最小击中集,反之亦然。这一结果在 MUS 和 MCS 算法的开发中得到了广泛应用,并且也应用于许多不同的场景。近年来,提出了大量用于提取和枚举 MUS 和 MCS 的新算法。
### 2.3 运行示例
考虑一个教科书示例,用于对用户关于是否阅读某本书的偏好进行分类。该数据集的特征集为:{A(作者),T(主题),L(长度),W(阅读地点)},所有特征
0
0
复制全文
相关推荐









