Otsu算法理解

最新推荐文章于 2024-08-30 17:20:48 发布

我的babydog

最新推荐文章于 2024-08-30 17:20:48 发布

阅读量663

点赞数

CC 4.0 BY-SA版权

分类专栏：学习日记文章标签： cv

本文链接：https://blog.csdn.net/qq_30967115/article/details/103046732

学习日记专栏收录该内容

16 篇文章

订阅专栏

本文介绍了Otsu算法，用于图像二值化的阈值选择。通过计算类间方差σB2来评估不同灰度级阈值的分割效果，目标是最大化类间方差以提高分割的可分性。Otsu算法通过对图像直方图的分析，找到最佳分割阈值k*，从而实现图像的最优分割。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Otsu算法理解

$灰度级(0\sim255为256个灰度级)$
$n_i: 表示灰度级为i的像素个数$
$M N : 图像的像素$ ，即
$\begin{aligned} MN&=n_0+n_1+n_2+...+n_{L-1} \\ &=high*wide \end{aligned}$
则当直方图归一化后有分量 $p_i=n_i/MN$ 即每个灰度级在全图中所占的比重，则有
$\sum_{i=0}^{L-1}p_i = 1,\quad p_i\geq 0 \tag{1}$
然后我们假设我们有一个阈值 $T (k) = k, 0 < k < L - 1$ ，将直方图分为 $C_1$ ， $C_2$ 两个部分,则某一像素在 $C_1$ 中的概率 $P_1(k)$ 如下
$P_1(k)=\sum_{i=0}^{k}{p_i}\tag{2}$
同样的在 $C_2$ 中的概率 $P_2(k)$ 为
$P_2(k)=\sum_{i=k+1}^{L-1}{p_i}=1-P_1(k)\tag{3}$
此时分别计算 $C_1$ 区和 $C_2$ 区的平均灰度值 $m_1$ 、 $m_2$
$\begin{aligned} m_1(k)&=\sum_{i=0}^{k}iP(i/C_1) \\ &=\sum_{i=0}^{k}iP(C_1/i)P(i)/P(C_1) \tag{4} \\ &=\frac{1}{P_1(k)}\sum_{i=0}^{k}{ip_i} \end{aligned}$
其中， $P_1(k)$ 由式 $(1)$ 给出。第一行中的 $P(i/C_1)$ 是值 $i$ 在 $C_1$ 中的概率，则通过贝叶斯公式
$P(i/C_1) = P(C_1/i)P(i)/P(C_1)$
已知 $i$ 在 $C_1$ 内，所以 $P(C_1/i)=1$ ，由 $(2)$ 知 $P_1(k)=P(C_1)$ 。则 $m1(k)=1P1(k)∑i=0kipim_1(k)=\frac{1}{P_1(k)}\sum_{i=0}^{k}{ip_i}$
同理可得 $C_2$ 中的 $m 2$
$\begin{aligned} m_2(k) &= \sum_{i=k+1}^{L-1}{iP(i/C_2)} \\ &=\frac{1}{P_2(k)}{\sum_{i=k+1}^{L-1}{ip_i}} \tag{5} \end{aligned}$
到k的累加均值则为
$m(k)=\sum_{i=0}^{k}{ip_i}\tag{6}$
全局均值，即整张图像的平均灰度
$m_G = \sum_{i=0}^{L-1}{ip_i}\tag{7}$
则得到
${P_1}{m_1}+{P_2}{m_2}={m_G}\tag{8}$
和
${P_1}+{P_2}={1}\tag{9}$
那么接下来该如何说明这个阈值 $k$ 的效果呢，我们使用了归一化的无量纲矩阵(我也不知道这个名词是啥意思，但是看下去，你能懂它的内容)：
$\eta = \frac{\sigma_B^2}{\sigma_G^2}\tag{10}$
其中， $σG2\sigma_G^2$ 是全局方差[即图像中所有像素的灰度方差，就是每个像素和均值对比]：
${\sigma_G^2}=\sum_{i=0}^{L-1}{(i-mG)^2}{p_i}\tag{11}$
$σB2\sigma_B^2$ 是类间方差，定义为
$\sigma_B^2 = {P_1(m_1-m_G)^2}+{P_2(m_2-m_G)^2}\tag{12}$
将 $(8)$ 和 $(9)$ 代入该表达式 $(12)$ ，接着再将 $(3)$ 和 $(7)$ 代入，可写为：
$\begin{aligned} {\sigma_B^2} &= {P_1}{P_2}{(m_1-m_2)^2} \\ &=\frac{({m_G}{P_1}-m)^2}{P_1({1-P_1})}\tag{13} \end{aligned}$
从上面的表达式中我们可以看出 $m_1$ 和 $m_2$ 彼此隔得越远， $σB2\sigma_B^2$ 越大，这表明类间方差是类之间的可分性度量[就是看两个类之间差的多不多]，
然后通过 $(11)$ 我们知道 $σG2\sigma_G^2$ 在一张图中是固定的，即为一个常数，若我们想要质量 $η\eta$ 好的话就要最大化 $σB2\sigma_B^2$ ，即在阈值集合 $k$ 中找到一个 $k^*$ 使得
$σB2(k∗)=max⁡0≤k≤L−1σB2(k)(14)\sigma_B^2(k^*)=\max\limits_{0\leq{k}\leq{L-1}}{\sigma_B^2}(k) \tag{14}$
找到 $k^*$ 后便可对图像进行分割：
$\begin{cases} &1,\quad f(x,y)>k^*\\ &0,\quad f(x,y)\leq k^* \end{cases}\tag{15}$