高维神经影像数据中的异常值检测与病理运动模式建模
立即解锁
发布时间: 2025-08-21 01:33:56 阅读量: 1 订阅数: 8 


医学图像计算与计算机辅助介入技术进展
### 高维神经影像数据中的异常值检测与病理运动模式建模
#### 1. 引言
在医学影像领域,尤其是脑成像中,受试者之间的变异性是一个显著的问题。部分变异性可视为正常波动,对诊断有一定意义,但也有部分是由扫描仪不稳定、实验问题或采集伪影等因素导致的干扰,这些干扰可能会掩盖真正的研究效应,如大脑功能组织与疾病、心理或遗传因素相关的变异性。
异常数据的检测对于确保后续统计分析的稳健性至关重要。然而,这一检测过程面临诸多挑战:
- 图像,特别是脑图像,是复杂的高维对象,具有未知的潜在结构。
- 异常检测问题通常是无监督的,难以在训练数据上进行校准。
- 很多情况下,无法对信号或其变异性进行归一化。
目前,高维分析方法主要应用于高信噪比数据,如解剖图像,但这些方法对异常数据不稳健,不适用于功能磁共振成像(fMRI)。已有的单变量异常检测方法和模型多元框架也存在一定局限性,如不适合大数据集或缺乏统计控制。因此,研究在高维情况下的异常检测方法具有重要意义。
#### 2. 病理运动模式建模与异常检测方法
##### 2.1 病理运动模式建模
提出了一种将特定病理运动模式建模为流形的方法。该流形将病理运动表示为与正常状态的偏差,流形原点即为正常状态。通过该方法可以计算个体与给定病理模式之间的距离。实验表明,学习数据的非线性嵌入是必要的,该方法对于评估运动异常的不同阶段具有重要意义。在心脏再同步治疗(CRT)的背景下,该方法可以改善治疗响应者的选择,实现新候选者与影响CRT结果的特定机械不同步模式的可重复比较。
##### 2.2 异常检测方法
- **MCD 估计器和 FastMCD 算法**:对于多维高斯数据,Rousseeuw 的最小协方差行列式(MCD)估计器是最先进的稳健协方差估计器,可通过 FastMCD 算法计算。给定一个包含 n 个 p 维观测值的数据集,MCD 旨在找到 h 个观测值(支持集),其散布矩阵的行列式最小。为使散布矩阵条件良好,h 必须大于 \(h_{min}=\frac{n + p + 1}{2}\)。当 \(\frac{p}{n}\) 增大时,\(h_{min}\) 增加,若异常值数量超过 \(\frac{n - p - 1}{2}\),则可能会将异常值包含在协方差估计中。当 \(p = n - 1\) 时,MCD 估计器等同于无偏最大似然估计器,不具有稳健性。当 \(p \geq n\) 时,MCD 估计器未定义。
- **正则化 MCD 估计器(R - MCD)**:为解决 MCD 估计器的上述问题,提出使用一半的观测值作为支持集(\(h = \frac{n}{2}\)),并通过正则化来补偿协方差估计中数据的不足。采用岭正则化,设 \(\lambda \in R^+\) 为正则化参数,\((\mu_r, \Sigma_r)\) 是使惩罚负对数似然最大化的位置和协方差估计:
\[
(\mu_r, \Sigma_r) = \arg\min_{\mu,\Sigma} \left\{ \log |\Sigma| + \frac{1}{n} \sum_{i = 1}^{n} (x_i - \mu)^T \Sigma^{-1} (x_i - \mu) + \lambda \text{Tr} \Sigma^{-1} \right\}
\]
得到 \(\Sigma_r = \frac{X^T X}{n - 1} + \lambda I_{dp}\) 和 \(\mu_r = \frac{1}{n} X^T 1_n\)。
- **Fast R - MCD 算法的收敛性**:Fast - MCD 是一种迭代算法,通过使用数据最均匀部分的协方差定义的马氏距离逐步剔除异常值。在新的 Fast - R - MCD 算法中,用岭估计替换 MCD 中用于定义马氏距离的样本协方差矩阵。Fast - R - MCD 的收敛性基于以下引理:
\[
\forall \eta > 0, (\mu_r, \Sigma_r) = \left\{ \arg\min_{\mu,\Sigma} |\Sigma|, \text{s.t. } E \left[ (X - \mu)^T \Sigma^{-1} (X - \mu) \right] + \lambda \text{tr} \Sigma^{-1} = \eta \right\}
\]
这直接意味着在 Fast - R - MCD 算法的每次迭代中,\(\Sigma_r\) 的行列式将减小。
- **设置正则化参数 \(\lambda\)**:首先以 \(\lambda = \frac{\text{tr}(\hat{\Sigma})}{n p}\) 作为初始猜测,其中 \(\hat{\Sigma}\) 是整个数据集的无偏经验协方差矩阵。然后,像 Fast - MCD 方法一样,分离出一组未受污染的 \(\frac{n}{2}\) 个观测值。设 \(\lambda = \delta \frac{\text{tr}(\hat{\Sigma}_{pure})}{n p}\),其中 \(\hat{\Sigma}_{pure
0
0
复制全文
相关推荐








