利用jTessBoxEditor工具进行Tesseract3.02.02样本训练,提高识别率
1 . 下载Tesseract-OCR(相关版本自行选择)
得到目录结构如下:
tessdata目录为相关的语言包文件目录
2 .下载jTessBoxEditor(运行环境为java虚拟机)
得到目录结构如下:
打开方式如下:
工具都安装完成了,我们接下来测试下tesseract
我的测试图片如下:
在命令行输入 : tesseract b.jpg output -l eng -psm 7
其中eng为你tesseract目录tessdata里的已有的eng语言包
接下来把识别的结果用文本打