33、基于FCN的文本行分割与基于深度学习的多手手势精确识别

u0v1w2x3

于 2025-06-23 09:52:43 发布

阅读量23

点赞数

CC 4.0 BY-SA版权

分类专栏：计算机视觉与图像处理：前沿与应用文章标签： FCN 文本行分割形态学运算

本文链接：https://blog.csdn.net/u0v1w2x3/article/details/149363010

计算机视觉与图像处理：前沿与应用专栏收录该内容

55 篇文章 ¥399.00 ¥499.90

订阅专栏

超级会员免费看

基于FCN的文本行分割与基于深度学习的多手手势精确识别

基于FCN的文本行分割

在处理文档图像时，文本行分割是一项重要任务。这里介绍一种基于全卷积网络（FCN）的文本行分割方法。

后处理操作

FCN生成的输出可能存在文本行未完全分离的情况。为了解决这个问题，需要进行后处理操作，主要包括形态学开运算和形态学膨胀运算。
- 形态学开运算 ：对FCN输出的图像进行形态学开运算，可初步分离文本行。例如，对图5(b)的图像进行形态学开运算后，结果如图5(c)所示，此时各文本行已初步分离，但单文本行内仍存在一些断开情况。
- 形态学膨胀运算 ：为消除单文本行内的断开间隙，使用大小为1 × l的水平线状结构元素进行形态学膨胀运算，最终得到所需输出，如图5(d)所示。

graph LR
    A[FCN输出图像] --> B[形态学开运算]
    B --> C[单文本行存在断开]
    C --> D[形态学膨胀运算]
    D --> E[最终输出图像]

实验结果

了解本专栏

超级会员免费看