python爬虫（1）-使用requests和beautifulsoup库爬取中国天气网

最新推荐文章于 2025-07-11 11:43:43 发布

静水流深~

最新推荐文章于 2025-07-11 11:43:43 发布

阅读量7.2k

点赞数 4

CC 4.0 BY-SA版权

分类专栏： python爬虫文章标签： IT 爬虫天气 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42359480/article/details/88881831

python爬虫（1）-使用requests和beautifulsoup库爬取中国天气网

使用工具及准备

python3.7（python3以上都可以）
pycharm IDE （笔者习惯使用pycharm，也可以使用其他的）
URL: http://www.weather.com.cn/weather/101230101.shtml
beautifulsoup4、requests、lxml库（pip3 install beautifulsoup4，pip3 install requests）

重点来了

（1）因为beautifulsoup要传入的是Unicode类型数据，所以首先要得到网页的纯文本，这就会用到requests库了，先利用requests的text得到纯文本

利用requests的get()函数发送get请求，get函数可以接受数个参数，详情看http://docs.python-requests.org/zh_CN/latest/user/quickstart.html，我们这里就用两个参数，URL（请求地址）以及headers（特别注意，requests库默认的编码方式是Unicode编码，但是此网站是utf-8编码，所以要指定一下编码方式）

import requests

url =

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。