打码平台处理验证码
众所周知,爬虫很多时候在处理模拟登陆的时候,有时候会遇到需要处理验证码的情况,这个时候就会有点麻烦,如果想要他们可以继续的自动的处理好并且登陆的话,那就需要对验证码进行识别并且带上验证码数据进行处理。?
正文
思路:
- 1.是使用人工打码平台进行处理
- 2.使用程序编程
- 深度学习进行处理
- 机器学习进行处理
?本文暂时只讨论最简单的一种,那就是第一种,使用人工打码平台进行处理。剩下的有机会也进行探索,算是给自己拓宽一下思路。
首先当然是百度查找打码平台,我这儿直接百度搜 云打码 ,然后找到了一家,按要求注册,并且联系了客服要到了试用以及 api的试例程序,
如下图所示,然后试用处理,打开他们的试例代码,把验证码图片改为自己同级目录下的图片。
然后跑一下实例,进行简单的四位英文字母混合的验证码的识别。
如上图所示,可以看到,与上面的验证码图片的验证码一致,已经正确的识别了验证码。如果这个时候爬虫需要就可以把这个识别后的结果带上继续爬取了。
总结
?类似这样的平台好像还是挺多的,然后针对不同的验证码会有不同的验证方式,大家可以多多研究探索。此博文只测试最简单的四字母数字混合的验证码。
有不同的验证方式,大家可以多多研究探索。此博文只测试最简单的四字母数字混合的验证码。