文章目录
前言
本篇内容,我是在基础专栏讲过的,为什么在这个专栏拿出来?说明我们爬虫要用到正则。如果你看不懂本专栏的内容,你需要看我基础专栏好好学一下:python全栈基础专栏
正则表达式的作用是什么?我们网页抓取到的内容很多,我们不可能全部都获取,只需要其中的一部分内容,因此我们需要使用正则来匹配我们想要的内容。
正则表达式模块
Python 有一个名为 的内置包re,可用于处理正则表达式。导入re模块:
import re
Python中的正则表达式
导入re模块后,您可以开始使用正则表达式。
例如:搜索字符串以查看它是否以“The”开头并以“Spain”结尾:
import re
txt = "The rain in Spain"
x =