问题: 识别验证码中的运算
最终识别效果不好,仍在想方法
环境:
1. Ubuntu 16.04
2. Python 3.5.2
使用了百度的OCR(optical character recognition)接口,发现无法识别验证码中的数字,无法使用。
1.安装项目依赖
#1.tesseract-ocr安装
sudo apt-get install tesseract-ocr
#2.pytesseract安装
sudo apt-get install python3-pip
sudo pip3 install pytesseract
#3.Pillow 安装
sudo pip3 install pillow
#4.numpy 安装
sudo pip3 install numpy
#5.openCV
pip install opencv-python
# -*- coding: UTF-8 -*_
from PIL import Image
from PIL import ImageFilter
from pytesseract import *
import PIL.ImageOps
def initTable(threshold=140):
table = []
for i in range(256):
if i < threshold:
table.append(0)
else:
table.append(1)
return table
im = Image.open('3.png')
#图片的处理过程
im = im.convert('L')
binaryImage = im.point(initTable(), '1')
im1 = binaryImage.convert