Python3爬取百度贴吧网页
第一次写博客,记录自己学习python爬虫的经历以及遇到的坑,接下来从最简单的下载网页开始。
python版本:3.6.3
IDE:PyCharm
可以看到kw后面跟着的是贴吧的名字,所以我们拿到的url就是url = "http://tieba.baidu.com/f?",kw的值可以在程序中输入我们想要爬取的贴吧名字,pn的值在这里代表的应该是跳过的帖子数,每页50个,可以帮助
原创
2017-12-16 21:05:51 ·
644 阅读 ·
0 评论