用八爪鱼爬取微博热门评论

本文介绍了如何使用八爪鱼爬虫工具抓取微博热门评论。通过设置爬虫任务,包括取消“在新标签中打开页面”的选项,配置Ajax加载超时等,以应对Ajax请求。在完成爬取后,可以通过导出功能将数据保存为Text、Html、Excel或数据库格式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关于八爪鱼

八爪鱼, 是一款简单易操作的爬虫工具。当然这种工具也有一定的局限性,可定制性肯定没有用一些爬虫框架(scrapy等)好(毕竟代码是自己写的,哈哈)。

使用八爪鱼

最近,使用八爪鱼爬取了一些微博的热门评论。当然,使用新浪微博API也是可以的。但是,自己为了快嘛,也想了解一下这个工具。
八爪鱼软件中基本爬取工作都有教程的。下面,我就以爬取微博热门评论,讲解一下,足以应付八爪鱼的基本使用了。

安装

八爪鱼目前只有Windows版本,没有Mac版本,所以我在虚拟机中装了一个八爪鱼。
八爪鱼下载, 下载安装无脑下一步就好了。
登陆的时候需要提前注册账号,然后用注册号的账号登录即可。

爬虫任务配置

  1. 创建任务(高级模式)
    爬取页面
  2. 设置基本信息
  3. 设置工作流程(主要参考教程)
    整个任务配置
    点击元素设置
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值