
Python爬虫
文章平均质量分 92
Python爬虫
西柚小萌新吖(●ˇ∀ˇ●)
***西南石油大学的小柚子*** ***好好学习,天天向上*** ***开源万岁,技术无界*** ***可以的话,点个关注哇,感谢***
vx:13438784965
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Python爬虫实战篇】--Selenium爬取Mysteel数据
任务:爬取我的钢铁网的钢材价格指数数据。原创 2025-04-24 22:45:10 · 1170 阅读 · 0 评论 -
【Python爬虫基础篇】--4.Selenium入门详细教程
Selenium 是一种开源工具,用于在Web 浏览器上执行自动化测试(使用任何 Web 浏览器进行 Web 应用程序测试)。提供一套测试函数,用于支持Web自动化测试。函数非常灵活,能够完成界面元素定位、窗口跳转、结果比较。重申一下,Selenium 仅可以测试Web应用程序。我们既不能使用 Selenium 测试任何桌面(软件)应用程序,也不能测试任何移动应用程序。多浏览器支持如IE、Firefox、Safari、Chrome、Android手机浏览器等。支持多语言。原创 2025-04-24 21:53:31 · 3200 阅读 · 0 评论 -
【Python爬虫基础篇】--3.cookie和session
指某些网站为例辨别用户身份,进行会话跟踪而存储在用户本地终端上的数据。原创 2025-04-22 21:27:49 · 1631 阅读 · 0 评论 -
【Python爬虫实战篇】--爬取豆瓣电影信息(静态网页)
爬取豆瓣前250电影的信息,F12打开网页控制台,查看网页元素,发现网页数据直接可以查看到,为静态网页数据,较为简单。原创 2025-04-21 21:42:04 · 1742 阅读 · 0 评论 -
【Python爬虫基础篇】--2.模块解析
大概会用到以下这些模块requestsaiohttpseleniumplaywrightlxmlrescrapy。原创 2025-04-18 17:49:10 · 1828 阅读 · 0 评论 -
【Python爬虫基础篇】--1.基础概念
网络爬虫,是一种按照一定规则,自动抓取互联网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。例如:传统的通用搜索引擎AltaVista,Yahoo!和Google等,作为一个辅助人们检索信息的工具也存在着一定的局限性,通用搜索引擎的目标是尽可能大的网络覆盖率,返回的结果包含大量用户不关心的网页,为了解决上述问题,定向抓取相关网页资源的爬虫应运而生。原创 2025-04-17 20:52:59 · 2213 阅读 · 0 评论