图像特征表示与处理技术解析
立即解锁
发布时间: 2025-09-02 01:13:18 阅读量: 5 订阅数: 21 AIGC 

### 图像特征表示与处理技术解析
#### 1. 混合图像模板(Hybrid Image Templates)
混合图像模板(HIT)在图像分析中扮演着重要角色。一个 HIT 模板包含 K 个原型 $\{B_k 或 h_k, k = 1, \cdots, K\}$,这些原型分别用于草图、纹理/梯度、平整度和颜色块,它们定义了不同维度的 K - 子空间(或 $\epsilon$ - 球)$\mathcal{R}(B_k)$ 或 $\mathcal{R}(h_k)$。这些 $\epsilon$ - 球以不同的度量对图像空间进行量化。
对于格点 $D$ 上的输入图像 $I$,它会被投影到 HIT 上,并由一个响应向量表示:
$\mathbf{I} \to (r_1, r_2, \cdots, r_K)$
其中 $r_k$ 是一个软度量,用于衡量图像块 $\mathbf{I}_{D_k}$ 是否属于由相应原型定义的子空间。
##### 1.1 模板学习算法
学习混合图像模板的算法旨在从一组图像示例中自动学习模板。该算法的目标是学习一系列模型,从初始或参考模型 $q$ 逐步逼近目标图像分布 $f$:
$q = p_0 \to p_1 \to p_2 \to \cdots \to p_K \approx f$
这些模型会依次匹配从 $f$ 的样本中收集到的观察边际统计量。随着模型 $p$ 和 $f$ 之间匹配的边际统计量增多,$p$ 会在减少 Kullback - Leibler 散度 $KL(f \parallel p)$ 的意义下单调逼近 $f$。
学习算法的主要输入包括:
- 一组正例:$\mathcal{I}^+ = \{\mathbf{I}_1, \cdots, \mathbf{I}_n\} \sim f$
- 一组反例:$\mathcal{I}^- = \{\mathbf{J}_1, \cdots, \mathbf{J}_N\} \sim q$
反例仅用于在预计算步骤中汇集一维特征响应的边际直方图。
图像格点 $D$ 会被扫描窗口划分为多个尺度的重叠块,扫描窗口的步长约为窗口大小的 10%。然后计算所有正例图像的相应原型和响应。草图原型 $B_i$ 由 Gabor 字典 $\Phi$ 指定,直方图原型 $h_k$ 通过计算模板格点同一区域的正例直方图并取平均值得到。这样会得到大量的候选块:
$\Omega_{cand} = \{D_j, \ell_j, \{B_j 或 \mathbf{h}_j\}: j = 1, 2, \cdots, M\}$
从这些候选块中,会选择最具信息性的块及其对应的原型用于 HIT。
在第 $k$ 步,我们有一个包含 $k - 1$ 个块的 HIT 和模型 $p = p_{k - 1}$:
$HIT_{k - 1} = (\{D_j, \ell_j, B_j 或 \mathbf{h}_j, \delta_j, j = 1, \cdots, k - 1\}, \Theta_{k - 1})$
考虑候选块 $D_k$ 及其在 $n$ 个正例和 $N$ 个反例上的响应:
$\{r_{k, i}^+, i = 1, \cdots, n\}, \{r_{k, i}^-, i = 1, \cdots, N\}$
设 $\overline{r}_k^+$ 和 $\overline{r}_k^-$ 分别为两组样本的均值。添加该块到模板的增益通过目标边际分布 $f(r_k)$ 和当前模型 $p_{k - 1}(r_k)$ 之间的 KL - 散度来衡量,这代表了训练数据中尚未被模型捕获的新信息。在所有候选块中,选择增益最大的块。
为了估计这个增益,使用蒙特卡罗方法,从 $f(r_k)$ 和 $p_{k - 1}(r_k)$ 中采样。显然 $\{r_{k, i}^+\}$ 是 $f(r_k)$ 的公平样本,而从 $p_{k - 1}(r_k)$ 采样时,可使用重要性采样。在满足一定条件下,$p_{k - 1}(r_k) = q(r_k)$,因此 $\{r_{k, i}^-\}$ 可作为 $p_{k - 1}(r_k)$ 的样本。
对于选定的块 $D_k$,新模型 $p = p_k$ 需要满足以下条件:
$\begin{align*}
p_k^* &= \arg \min KL(p_k \parallel p_{k - 1}) \\
s.t. \quad E_{p_k}[r_k] &= E_f[r_k]
\end{align*}$
通过求解带有拉格朗日乘子 $\{\lambda_j\}$ 和 $\gamma$ 的欧拉 - 拉格朗日方程,可得到:
$p
0
0
复制全文
相关推荐









