一款非常牛逼的Java爬虫框架(高度灵活可配置)

介绍

平台以流程图的方式定义爬虫,是一个高度灵活可配置的爬虫平台

特性

  • 支持Xpath/JsonPath/css选择器/正则提取/混搭提取

  • 支持JSON/XML/二进制格式

  • 支持多数据源、SQL select/selectInt/selectOne/insert/update/delete

  • 支持爬取JS动态渲染(或ajax)的页面

  • 支持代理

  • 支持自动保存至数据库/文件

  • 常用字符串、日期、文件、加解密等函数

  • 支持插件扩展(自定义执行器,自定义方法)

  • 任务监控,任务日志

  • 支持HTTP接口

  • 支持Cookie自动管理

  • 支持自定义函数

插件

  • Selenium插件

  • Redis插件

  • OSS插件

  • Mongodb插件

  • IP代理池插件

  • OCR识别插件

  • 电子邮箱插件

  • 微信搜索公众号:架构师指南,回复:架构师 领取资料 。

项目部分截图

爬虫列表

93a49acc205acfd1ba804817dcf12043.png

爬虫测试9d24b1814454e262938007c5bb353d5a.gif

Debug

c0bc0861fba0edf3ba4451a7e0643d39.png

日志

1f6e2c6f45fc5a55fe7977b1036c6d95.png

免责声明

请勿将spider-flow应用到任何可能会违反法律规定和道德约束的工作中,请友善使用spider-flow,遵守蜘蛛协议,不要将spider-flow用于任何非法用途。

如您选择使用spider-flow即代表您遵守此协议,作者不承担任何由于您违反此协议带来任何的法律风险和损失,一切后果由您承担。

开源地址

https://gitee.com/ssssssss-team/spider-flow

官网:

https://www.spiderflow.org/


 

PS:如果觉得我的分享不错,欢迎大家随手点赞、在看。


 

 关注公众号:Java后端编程,回复下面关键字 


 

要Java学习完整路线,回复  路线 

缺Java入门视频,回复: 视频 

要Java面试经验,回复  面试 

缺Java项目,回复: 项目 

进Java粉丝群: 加群 


 

PS:如果觉得我的分享不错,欢迎大家随手点赞、在看。


 

(完)

加我"微信" 获取一份 最新Java面试题资料

2cd7f21be0df18eb94fa54674ae4ef98.jpeg

请备注:666,不然不通过~

最近好文

1、必须推荐的一个后台管理系统

2、无意中发现了一位清华妹子的资料库!

3、Java后端编程读者群正式成立了!

4、一套简单通用的Java后台管理系统,拿来即用

5、36 张图梳理 Intellij IDEA 常用设置


 

outside_default.png


 
最近面试BAT,整理一份面试资料《Java面试BAT通关手册》,覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。
获取方式:关注公众号并回复 java 领取,更多内容陆续奉上。

明天见(。・ω・。)ノ♡

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值