Halcon OCR识别
OCR(Optical Character Recognition),光学字符识别的英文缩写。
OCR主要步骤
- 图像预处理
- 目标区域分割(ROI)
- 字符识别
- 结果处理
1. 图像预处理
对原始图像进行灰度化,二值化,模板匹配,降噪,增强等!
2.目标区域分割(ROI)
对预处理后的图像进行ROI提取,分割出单个字符组成的区域
3.字符识别,即模式识别技术
- 训练OCR,利用大量的模板图片训练出一个字符分类器
- 使用OCR,将训练好的分类器用于字符分类,类似于手写数字识别!
4.结果处理
将识别完的文字按特定的次序和规则组合输出!
上述4个步骤中,OCR的核心部分自然是第3步,即模式识别技术
模式识别技术
训练分类器
第一步:将分割好的字符区域加入训练集,使用函数
append_ocr_trainf(Character,Image::Class,TrainingFile:)
参数解析:
Character:字符区域
Image:灰度图像
Class:分类标签
TrainingFile:训练集文件名,一般后缀为.trf
功能说明:用于制作训练集,使用与TrainingFile文件相同的训练文件格式,将字符附加到现有文件。如果该文件不存在,则生成新文件。TrainingFile如果未指定扩展名,则默认添加扩展名.trf
第二步:创建分类器,使用函数
create_ocr_class_mlp(::WidthCharacter, HeightCharacter,Int