Python爬虫之scrapy框架

本文详细指导如何使用Scrapy在Python中创建一个针对Baidu的爬虫,从创建项目、设置配置,到在CMD和PyCharm中运行。重点介绍了关键步骤和设置,适合初学者入门。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

安装

创建项目

1、找到自己python爬虫项目的路径。

2、cmd创建scrapy项目。

我这里的路径是C:\Users\Administrator\PycharmProjects\untitled1

打开cmd,cd到这个路径

创建scrapy项目

因为项目名称一般都是大写开头,而且也习惯大写开头了 (之前弄一些东西的时候,总的和分的开头都是小写,弄到后面发现搞错,直接疯掉)

然后cd到Baidu这个文件夹里面去

 然后创建爬虫文件

我这里顺便带了个域名

 

这,就是创建完了,文件在Baidu里的spiders的baidu这里。

打开pycharm看看

这里我想提取到  百度一下,你就知道

 则代码:

 下面呢,就是来设置一下

打开项目里面的settings

 设置修改:

 

然后呢,切换到cmd输入 

这里的baidu是

 

 

这里的话还可以在pycharm里面运行,

 

 在这里创建一个run

from scrapy import cmdline
cmdline.execute('scrapy crawl baidu'.split())

运行后效果一样的

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值