Python爬虫_西柚小萌新吖(●ˇ∀ˇ●)的博客-CSDN博客

Python爬虫

关注

文章平均质量分 92

Python爬虫

关注数：文章数：6 文章阅读量：11776 文章收藏量：139

作者: 西柚小萌新吖(●ˇ∀ˇ●)

***西南石油大学的小柚子*** ***好好学习，天天向上*** ***开源万岁，技术无界*** ***可以的话，点个关注哇，感谢*** vx:13438784965

展开

专栏收录文章

【Python爬虫实战篇】--Selenium爬取Mysteel数据

任务：爬取我的钢铁网的钢材价格指数数据。

原创 2025-04-24 22:45:10 · 1170 阅读 · 0 评论
【Python爬虫基础篇】--4.Selenium入门详细教程

Selenium 是一种开源工具，用于在Web 浏览器上执行自动化测试（使用任何 Web 浏览器进行 Web 应用程序测试）。提供一套测试函数，用于支持Web自动化测试。函数非常灵活，能够完成界面元素定位、窗口跳转、结果比较。重申一下，Selenium 仅可以测试Web应用程序。我们既不能使用 Selenium 测试任何桌面（软件）应用程序，也不能测试任何移动应用程序。多浏览器支持如IE、Firefox、Safari、Chrome、Android手机浏览器等。支持多语言。

原创 2025-04-24 21:53:31 · 3200 阅读 · 0 评论
【Python爬虫基础篇】--3.cookie和session

指某些网站为例辨别用户身份，进行会话跟踪而存储在用户本地终端上的数据。

原创 2025-04-22 21:27:49 · 1631 阅读 · 0 评论
【Python爬虫实战篇】--爬取豆瓣电影信息(静态网页）

爬取豆瓣前250电影的信息，F12打开网页控制台，查看网页元素，发现网页数据直接可以查看到，为静态网页数据，较为简单。

原创 2025-04-21 21:42:04 · 1742 阅读 · 0 评论
【Python爬虫基础篇】--2.模块解析

大概会用到以下这些模块requestsaiohttpseleniumplaywrightlxmlrescrapy。

原创 2025-04-18 17:49:10 · 1828 阅读 · 0 评论
【Python爬虫基础篇】--1.基础概念

网络爬虫，是一种按照一定规则，自动抓取互联网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。随着网络的迅速发展，万维网成为大量信息的载体，如何有效地提取并利用这些信息成为一个巨大的挑战。例如：传统的通用搜索引擎AltaVista，Yahoo!和Google等，作为一个辅助人们检索信息的工具也存在着一定的局限性，通用搜索引擎的目标是尽可能大的网络覆盖率，返回的结果包含大量用户不关心的网页，为了解决上述问题，定向抓取相关网页资源的爬虫应运而生。

原创 2025-04-17 20:52:59 · 2213 阅读 · 0 评论

Python爬虫

作者: 西柚小萌新吖(●ˇ∀ˇ●)

【Python爬虫实战篇】--Selenium爬取Mysteel数据

【Python爬虫基础篇】--4.Selenium入门详细教程

【Python爬虫基础篇】--3.cookie和session

【Python爬虫实战篇】--爬取豆瓣电影信息(静态网页）

【Python爬虫基础篇】--2.模块解析

【Python爬虫基础篇】--1.基础概念