前言
pyquery是一个类似于JQuery的库,能够方便的通过css选择器定位元素,如果还不了解css选择器,可以先去看一下我 的另一篇博客
https://blog.csdn.net/weixin_44112790/article/details/86624844
安装
cmd
pip install pyquery
pycharm
from pyquery import PyQuery as pq
这里起个别名pq,便于之后的操作
简单演示
我们试着将这些文字提取出来,我这里简单使用选择器 .hotnews ul li a来实现定位
代码如下
## 请求
response = requests.get("http://news.baidu.com/")
html = response.content.decode("utf8", "ignore")
## 解析
doc = pq(html)
items = doc.find('.hotnews ul li a').items()
for item in items:
print(item.text())
结果
学习推荐
文档推荐
https://pythonhosted.org/pyquery/
视频推荐
https://www.bilibili.com/video/av18202461/?p=12