【Keras计算机视觉OCR文字识别】文字检测算法中CTPN、CRAFT的讲解（图文解释超详细）

最新推荐文章于 2025-06-29 09:30:18 发布

showswoller

最新推荐文章于 2025-06-29 09:30:18 发布

阅读量3.1k

点赞数 18

CC 4.0 BY-SA版权

分类专栏：计算机视觉文章标签：算法计算机视觉文字检测 cnn keras

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jiebaoshayebuhui/article/details/128253110

觉得有帮助麻烦点赞关注收藏~~~

一、OCR文字识别的概念

OCR（Optical Character Recognition）图像文字识别是人工智能的重要分支，赋予计算机人眼的功能，可以看图识字。如图6-1所示，图像文字识别系统流程一般分为图像采集、文字检测、文字识别及结果输出四个部分。识别流程图如下

二、文字检测

传统的问题检测算法

输入一张文字图像，传统的文字检测算法将文字检测出来，要有图像预处理和文字行提取两个阶段，其中图像预处理包括几何校正、模糊校正、二值化等，文字行提取是基于版面分析获取文字行区域

预处理之后即可进行文字识别，文字行识别主要有基于切分的文字识别和不依赖切分的文字识别这两种方法，基于切分的文字识别方法需要先将文字行切分成单字，然后提取文字的方向梯度直方图或者通过卷积神经网络得到的特征信息，最后将提取的特征送入AdaBoost、SVM等分类器中进行识别，而不依赖于切分的文字识别方法能够对文本行直接进行识别，无须切分处理，主要包括基于滑窗的文字识别方法和基于序列的文字识别方法

基于深度学习的文字检测算法

基于深度学习的文本检测，通常遵循前面介绍的经典算法R-CNN网络框架，首先提取可能包含有文本的候选区域，之后利用卷积神经网络将其分类为文本或者非文本区域，并通过回归的方式校正文本区域的坐标位置信息。下面介绍CTPN CRAFT是目前最流行的两种文本检测算法，下面将着重介绍CTPN和CRAFT两种文本检测算法

1：基于CTPN的文本检测算法

CTPN算法是在目标检测算法Fasetr R-CNN模型上改进的算法，CTPN网络结

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

showswoller 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。