Python接管本地浏览器或者接管pyqt5搭建的浏览器,绕过WebDriver识别

本文介绍如何使用Python通过指定端口接管本地Chrome浏览器,避免被WebDriver识别,同时探讨利用PyQt5开发的浏览器进行爬虫操作的可能性。文中详细讲解了设置Chrome配置文件、环境变量及代码示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Python接管本地浏览器或者接管pyqt5搭建的浏览器,绕过WebDriver识别

首先打开chrome的目录,然后在命令行输入一下命令,为chrome开启一个端口

chrome.exe --remote-debugging-port=9222 --user-data-dir="C:\selenum\AutomationProfile"

对于-remote-debugging-port值,可以指定任何打开的端口。

对于-user-data-dir标记,指定创建新Chrome配置文件的目录。它是为了确保在单独的配置文件中启动chrome,不会污染你的默认配置文件。

还有,不要忘了在环境变量中PATH里将chrome的路径添加进去。

接下来用代码进行测试,能绕过浏览器识别到我们使用的selenium浏览器

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
 
chrome_options = Options()
chrome_options.add_experimental_option("debuggerAddress", "127.0.0.1:9222")  #接管使用该端口的chrome浏览器
chrome_driver = "C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe"
driver = webdriver.Chrome(chrome_driver, chrome_options=chrome_options)
print(driver.title)

2021.3.6 更新内容
此处还可以选择使用python的pyqt5 中开发的浏览器来实现绕过识别,当然这个绕过,我也不知道究竟有多少限制可以绕过,还是跟selenium一样的情况,这个我没有研究过,后面有机会我会尝试,利用pyqt5来开发浏览器可以参考我的另外一篇博客(python利用pyqt5开发一个自定义浏览器),通过pyqt5的浏览器来调用回调js来实现爬虫,这里我放出教程,具体大家可以试试

这里我放出回调js的参考链接:

https://blog.csdn.net/qq_20265805/article/details/82110264

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

码王吴彦祖

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值