paddleOcr 训练自定义数据

最新推荐文章于 2025-06-17 11:32:10 发布

matianlongg

最新推荐文章于 2025-06-17 11:32:10 发布

阅读量4.6k

点赞数 2

CC 4.0 BY-SA版权

分类专栏：深度学习文章标签： python paddlepaddle ocr

本文链接：https://blog.csdn.net/mtl1994/article/details/124010682

深度学习专栏收录该内容

32 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

本文介绍了如何使用PaddleOcr训练自定义OCR数据，包括环境配置、ppocrlabel工具进行图片标注、数据切分、模型训练、恢复训练及迁移学习等步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

paddleOcr 训练自定义数据

文章目录

paddleOcr 训练自定义数据
前言
一、创建环境
二、安装环境
三、使用ppocrlabel标注图片
- - - 1.打开图片目录
    - 2.导出标记结果、导出识别结果
四、训练
五、已经训练的模型，有了新数据需要继续训练
- - - 1.使用恢复训练
    - 2.使用迁移学习
总结

前言

环境

python: 3.7.5

paddlepaddle-gpu: 2.2.2

paddleocr: 2.4.0.1

#paddlepaddle
https://www.paddlepaddle.org.cn/
#paddleocr
https://github.com/PaddlePaddle/PaddleOCR
https://gitee.com/paddlepaddle/PaddleOCR

paddleocr 有三种模型 det 检测 cls 方向 rec 识别

一、创建环境

安装miniconda

https://blog.csdn.net/mtl1994/article/details/114968140

创建环境

#linux 需要先 source
conda create -n paddle_ocr python=3.9.7  --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/