机器视觉opencv教程(二):二值化、自适应二值化

机器视觉opencv教程(二):二值化、自适应二值化

一、二值化图基础概念

  • 定义:二值化图是仅含两种像素值的图像,通常为 0(纯黑色)255(纯白色)
  • 操作前提:二值化的处理对象必须是灰度图(无法直接对彩色图进行二值化),本质是通过 “阈值判断” 将灰度图的连续亮度值(0~255)映射为两种离散值,突出前景与背景的边界。
  • 核心目的:简化图像数据(仅 1 个通道 + 2 种值)、消除灰度噪声、强化目标区域(如文字识别中突出文字、工业检测中突出缺陷)。

在这里插入图片描述

二、传统二值化方法(基于全局固定阈值)

传统二值化通过设定全局唯一阈值(thresh)最大值(maxval,通常为 255),对灰度图所有像素统一判断,常见 5 种方法:

1. 阈值法(THRESH_BINARY)

  • 原理:像素值与阈值比较
    • 若像素值 ≤ thresh → 设为 0(黑)
    • 若像素值 > thresh → 设为 maxval(白)
  • 特点:亮部(> 阈值)保留为白色,暗部(≤阈值)转为黑色,适合前景比背景亮的场景(如白底黑字)。
import cv2
import numpy as np

# 1. 读取彩色图→转为灰度图(二值化前提)
image_np = cv2.imread('./gogogo.png')
# 【补充】检查图片读取状态
if image_np is None:
    raise ValueError("图片读取失败,请确认路径正确!")
image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)

# 2. 设定参数
thresh = 150  # 全局阈值(需手动调整,根据图像明暗度适配)
maxval = 255  # 二值化后的最大值(通常为255,纯白)

# 3. OpenCV接口实现(推荐,高效)
# ret:返回的阈值(与设定的thresh一致,传统方法中无实际作用)
# image_thresh:二值化结果(单通道图)
ret, image_thresh = cv2.threshold(image_gray, thresh, maxval, cv2.THRESH_BINARY)

# # 4. 手动实现(理解原理用)
# image_shape = image_gray.shape
# image_thresh = np.zeros((image_shape[0], image_shape[1]), dtype=np.uint8)
# for i in range(image_shape[0]):  # 遍历高度(行)
#     for j in range(image_shape[1]):  # 遍历宽度(列)
#         if image_gray[i, j] > thresh:
#             image_thresh[i, j] = maxval
#         else:
#             image_thresh[i, j] = 0

# 5. 显示结果
cv2.imshow('灰度图', image_gray)
cv2.imshow('THRESH_BINARY二值化图', image_thresh)
cv2.waitKey(0)  # 按任意键关闭窗口
cv2.destroyAllWindows()  # 释放资源

2. 反阈值法(THRESH_BINARY_INV)

  • 原理:与阈值法完全相反
    • 若像素值 > thresh → 设为 0(黑)
    • 若像素值 ≤ thresh → 设为 maxval(白)
  • 特点:暗部保留为白色,亮部转为黑色,适合前景比背景暗的场景(如黑底白字)。
import cv2
import numpy as np

# 1. 彩色图→灰度图
image_np = cv2.imread('./gogogo.png')
if image_np is None:
    raise ValueError("图片读取失败!")
image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)

# 2. 设定参数
thresh = 127  # 常用默认阈值(可根据图像调整)
maxval = 255

# 3. OpenCV接口实现(核心参数:cv2.THRESH_BINARY_INV)
ret, image_thresh = cv2.threshold(image_gray, thresh, maxval, cv2.THRESH_BINARY_INV)

# # 4. 手动实现(原理参考阈值法,判断条件反转)
# image_shape = image_gray.shape
# image_thresh = np.zeros((image_shape[0], image_shape[1]), dtype=np.uint8)
# for i in range(image_shape[0]):
#     for j in range(image_shape[1]):
#         if image_gray[i, j] > thresh:
#             image_thresh[i, j] = 0
#         else:
#             image_thresh[i, j] = maxval

# 5. 显示
cv2.imshow('THRESH_BINARY_INV二值化图', image_thresh)
cv2.waitKey(0)
cv2.destroyAllWindows()
  • 特点:暗部保留为白色,亮部转为黑色,适合前景比背景暗的场景(如黑底白字)。

3. 截断阈值法(THRESH_TRUNC)

  • 原理:限制像素值上限
    • 若像素值 > thresh → 设为 thresh(截断为阈值)
    • 若像素值 ≤ thresh → 保持原值不变
  • 特点:图像最大亮度为阈值,可抑制过亮区域(如强光噪声),但不是严格 “二值图”(仍含多个灰度值)。
import cv2
import numpy as np

# 1. 彩色图→灰度图
image_np = cv2.imread('./gogogo.png')
if image_np is None:
    raise ValueError("图片读取失败!")
image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)

# 2. 设定参数
thresh = 150  # 截断阈值(超过该值的亮度会被“压平”)
maxval = 255  # 此方法中maxval无实际作用(可设任意值)

# 3. OpenCV接口实现(核心参数:cv2.THRESH_TRUNC)
ret, image_thresh = cv2.threshold(image_gray, thresh, maxval, cv2.THRESH_TRUNC)

# # 4. 手动实现
# image_shape = image_gray.shape
# image_thresh = np.zeros((image_shape[0], image_shape[1]), dtype=np.uint8)
# for i in range(image_shape[0]):
#     for j in range(image_shape[1]):
#         if image_gray[i, j] > thresh:
#             image_thresh[i, j] = thresh
#         else:
#             image_thresh[i, j] = image_gray[i, j]

# 5. 显示(对比灰度图,亮部会明显变暗)
cv2.imshow('原灰度图', image_gray)
cv2.imshow('THRESH_TRUNC截断图', image_thresh)
cv2.waitKey(0)
cv2.destroyAllWindows()

4. 低阈值零处理(THRESH_TOZERO)

  • 原理:暗部置零,亮部保留
    • 若像素值 ≤ thresh → 设为 0(黑)
    • 若像素值 > thresh → 保持原值不变
  • 特点:仅保留亮部细节,暗部直接变黑,适合突出高亮度目标(如金属表面的反光缺陷)。

5. 超阈值零处理(THRESH_TOZERO_INV)

  • 原理:亮部置零,暗部保留
    • 若像素值 > thresh → 设为 0(黑)
    • 若像素值 ≤ thresh → 保持原值不变
  • 特点:仅保留暗部细节,亮部直接变黑,适合突出低亮度目标(如暗背景中的深色物体)。

三、OTSU 阈值法(自动找最优阈值)

1. 核心原理

  • OTSU(大津法)是自动阈值选择算法,无需手动调参:
    1. 将灰度图像素分为 “前景”(> 阈值)和 “背景”(≤阈值)两类;
    2. 遍历所有可能阈值(从灰度最小值 + 1 到最大值 - 1),计算 “类间方差”;
    3. 类间方差最大时的阈值即为 “最优阈值”(此时前景与背景区分最明显)。

2. 代码实现(需与传统二值化方法结合)

import cv2
import numpy as np

# 1. 彩色图→灰度图
image_np = cv2.imread('./flower.png')
if image_np is None:
    raise ValueError("图片读取失败!")
image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)

# 2. 设定参数(thresh仅为初始值,OTSU会自动覆盖)
thresh = 127  # 初始值无意义,OTSU会计算最优阈值
maxval = 255

# 3. OpenCV接口实现(核心:cv2.THRESH_OTSU + 传统方法)
# ret:返回OTSU计算出的最优阈值(不再是初始值127)
ret, image_thresh = cv2.threshold(
    image_gray, thresh, maxval, 
    cv2.THRESH_BINARY + cv2.THRESH_OTSU  # 结合阈值法,也可结合其他方法
)
print(f"OTSU自动计算的最优阈值:{ret}")  # 输出最优阈值,便于后续参考

# # 4. 手动实现(理解OTSU算法逻辑,实际用OpenCV接口即可)
# min_val = image_gray.min()
# max_val = image_gray.max()
# var_dict = {}  # 存储“阈值→类间方差”
# 
# for t in range(min_val + 1, max_val):
#     # 分割前景(>t)和背景(≤t)
#     foreground = image_gray[image_gray > t]
#     background = image_gray[image_gray ≤ t]
#     # 计算类间方差(公式:w0*(u0-u)^2 + w1*(u1-u),w为权重,u为均值)
#     w0 = len(foreground) / (image_gray.size)
#     w1 = len(background) / (image_gray.size)
#     u0 = foreground.mean() if len(foreground) > 0 else 0
#     u1 = background.mean() if len(background) > 0 else 0
#     u = (w0*u0) + (w1*u1)
#     class_var = w0 * (u0 - u)**2 + w1 * (u1 - u)**2
#     var_dict[t] = class_var
# # 找类间方差最大的阈值
# best_thresh = max(var_dict, key=var_dict.get)
# print(f"手动计算的最优阈值:{best_thresh}")

# 5. 保存+显示结果
cv2.imwrite('OTSU二值化图.png', image_thresh)  # 保存结果
cv2.imshow('OTSU二值化图', image_thresh)
cv2.waitKey(0)
cv2.destroyAllWindows()

3. 特点与适用场景

  • 优势:自动适配图像明暗,无需手动调阈值,比固定阈值更鲁棒;
  • 适用:前景与背景灰度差异明显的图像(如文档扫描图、简单目标检测);
  • 注意:仅适用于 “双峰灰度分布”(灰度直方图有两个明显峰值,分别对应前景和背景),若图像灰度分布均匀,效果较差。

四、自适应二值化(局部动态阈值)

1. 核心问题(传统方法的缺陷)

传统二值化(含 OTSU)用全局固定阈值,若图像明暗分布不均(如左侧亮、右侧暗),会导致部分区域二值化过度(亮区暗部变黑)或不足(暗区亮部变白)。

2. 自适应二值化原理

  • 对图像每个像素,用其局部邻域(如 3×3、5×5 窗口)的亮度计算 “局部阈值”,而非全局统一阈值;
  • 每个像素的阈值由自身周围像素决定,能自适应不同区域的明暗差异。
import cv2
import numpy as np

# 1. 读取彩色图→转为灰度图
image_np = cv2.imread('./gogogo.png')  # 建议用明暗不均的图测试(如逆光拍摄的图)
if image_np is None:
    raise ValueError("图片读取失败!")
image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)

# 2. 自适应二值化(核心函数:cv2.adaptiveThreshold)
image_binary = cv2.adaptiveThreshold(
    image_gray,                # 输入:单通道灰度图
    255,                       # 二值化最大值(通常为255)
    cv2.ADAPTIVE_THRESH_GAUSSIAN_C,  # 局部阈值计算方法:高斯加权平均(推荐,更平滑)
    # cv2.ADAPTIVE_THRESH_MEAN_C,   # 备选:局部邻域均值(计算更快,可能有噪声)
    cv2.THRESH_BINARY,         # 二值化方法(可换为THRESH_BINARY_INV)
    blockSize=7,               # 局部邻域大小(必须为奇数,如3、5、7,越大越平滑)
    C=5                        # 从局部阈值中减去的常数(正数:降低二值化严格度,减少黑块)
)

# 3. 显示对比(与全局阈值法对比,明暗不均区域效果更优)
# 全局阈值法(对比用)
ret_global, image_global = cv2.threshold(image_gray, 127, 255, cv2.THRESH_BINARY)

cv2.imshow('原灰度图', image_gray)
cv2.imshow('全局阈值二值化', image_global)
cv2.imshow('自适应二值化', image_binary)
cv2.waitKey(0)
cv2.destroyAllWindows()

4. 关键参数说明

参数作用
blockSize局部邻域大小(奇数),越大对明暗不均的适应能力越强,但细节保留越少;
C阈值修正常数,正数→局部阈值降低(更多像素变白),负数→局部阈值升高(更多像素变黑);
阈值计算方法ADAPTIVE_THRESH_GAUSSIAN_C(高斯加权,效果好) vs ADAPTIVE_THRESH_MEAN_C(均值,速度快);

五、补充:常见问题与注意事项

  1. 图片读取失败:确保路径正确(相对路径需与代码文件同级,绝对路径需写全),格式支持(JPG、PNG、BMP 等);
  2. 二值化结果过暗 / 过亮:
    • 全局阈值法:调整thresh(暗→降低阈值,亮→升高阈值);
    • 自适应法:调整C(暗→增大C,亮→减小C)或blockSize
  3. OTSU 效果差:检查图像灰度直方图是否为 “单峰”(明暗分布均匀),此类图需用自适应二值化;
  4. 代码效率:手动实现仅用于理解原理,实际项目用 OpenCV 接口(C++ 优化,速度远快于 Python 循环)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员miki

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值