- 博客(53)
- 资源 (4)
- 问答 (1)
- 收藏
- 关注
原创 MyChrome.exe与Selenium联动避坑指南:User Data目录冲突解决方案
摘要: 在使用MyChrome.exe与Selenium进行自动化测试或数据采集时,User Data目录配置不当易引发冲突,导致浏览器启动失败或数据异常。解决方案包括:了解MyChrome默认User Data路径、避免Selenium额外设置目录、确保版本兼容性,以及谨慎管理扩展程序。冲突排查可通过检查版本匹配、查看日志、验证目录完整性及简化环境测试实现。正确处理目录冲突问题,能确保二者稳定联动,提升自动化任务效率。(150字)
2025-07-05 10:41:14
1047
原创 小红书自动化操作:使用本地Chrome和User Data实现高效反检测
摘要 本文介绍了一种使用Selenium驱动本地Chrome浏览器实现小红书自动化操作的技术方案。通过加载User Data目录保留浏览器指纹和登录状态,配合多项反检测配置(如修改User-Agent、隐藏WebDriver标识、注入JavaScript等),使自动化行为更接近真实用户。方案包含10个关键步骤,从基础配置到人机行为模拟,有效降低了被平台识别为机器人的风险。特别强调了随机窗口尺寸、滚动操作和延时等细节处理,并提供了指纹检测验证方法,为社交媒体自动化操作提供了可靠的技术实现路径。(149字)
2025-07-03 23:37:05
972
原创 Selenium 自动化测试中跳过机器人验证的完整指南:能用
本文介绍了使用Selenium绕过网站机器人验证的完整方案。重点分析了机器人验证的4种检测机制:浏览器指纹、WebDriver特征、行为模式和环境异常。提供了包含10个关键步骤的Python代码,通过隐藏WebDriver标识、模拟真实浏览器属性、随机化浏览行为等技术实现反检测。核心包括禁用自动化特征、注入JavaScript改写浏览器属性、随机窗口尺寸和滚动行为等。该方案可有效降低自动化程序被识别的风险,适用于需要稳定运行的爬虫和自动化测试场景。
2025-07-03 19:02:20
776
原创 Python数据解析与图片下载工具:从JSON到本地文件的自动化流程
本文介绍了一个Python工具,用于解析JSON数据并下载图片资源。该工具包含三个核心功能:1)解析JSON数据并提取指定变量;2)格式化展示提取的数据;3)从URL列表批量下载图片。通过json.loads转换数据,使用.get()方法安全提取变量,并根据数据类型智能展示。下载模块支持进度显示、异常处理和断点续传,自动处理URL解析和文件命名。安装依赖后,用户只需输入JSON数据即可完成解析和下载流程,适用于数据采集和自动化测试等场景。
2025-07-02 23:41:14
726
原创 Python时间管理工具:实现定时任务的时间点循环更新
本文介绍了一个Python时间管理工具,用于实现定时任务的循环调度。该工具通过预设时间点列表(如每天6:00、12:00、18:00、22:00)自动计算下一个执行时间,并持久化保存到文件中。核心功能包括跨天循环计算、时间点状态保存,适用于内容定时发布、数据备份等场景。文章详细解析了代码逻辑,包括时间点循环算法、边界处理等,并提供了使用方法、应用案例及优化方向。该工具轻量易用,无需复杂依赖,适合中小规模定时任务需求。
2025-07-02 23:39:40
738
原创 Python图片水印工具:给图片添加个性化文字水印
本文介绍了一个基于Python的图片水印工具,使用Pillow库实现图片右下角文字水印添加功能。核心功能包括:支持中文字体显示、透明度调节、自动计算水印位置,并兼容JPEG/PNG等格式。该工具简单易用,仅需几行代码即可完成图片版权标识,适用于摄影作品、营销素材等的版权保护。文章还提供了完整代码实现、使用说明和进阶优化方向,如批量处理、样式扩展等。通过这个工具,用户可以快速为图片添加个性化水印,平衡版权保护与视觉效果。
2025-07-02 23:38:06
350
原创 【python】pdf拆成图片,加中文,再合成pdf
摘要: 本文介绍了通过将PDF拆分为图片、添加中文水印后再合并为PDF的方法,但会导致PDF模糊。代码实现了PDF转图片、添加水印(支持中文字体)、图片合并为PDF的完整流程,包括字体兼容处理。方法虽可行,但存在图像质量损失问题,适用于对清晰度要求不高的场景。
2025-07-02 23:36:40
388
原创 使用CSDN作为Markdown编辑器图床
利用CSDN作为Markdown图床,无需额外注册第三方图床工具,操作便捷且免费。通过简单设置去除水印后,即可获得干净的图片引用链接,提升文档排版效率。
2025-06-11 18:39:59
270
原创 【无标题】测试
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Aek9LMRu-1749632928734)(https://a1.boltp.com/2025/06/11/6849478dd9860.jpg)]
2025-06-11 17:09:47
419
原创 coze中代码节点的使用
本文分享了图片文字识别插件的使用经验。经过3天摸索,作者弄清了数据结构:插件识别图片文字后会输出带索引的结果(如图)。代码节点分为函数变量、输入变量和输出变量三部分。通过args.params获取输入参数,return语句绑定输出变量。测试时可选择输入变量类型自动生成测试数据。文章配有3张示意图展示识别结果、代码结构和变量查看界面。
2025-06-11 15:23:01
409
原创 各个AI工具对比
工具核心优势领域特色功能智谱清言知识问答、创意生成网页预览、编程辅助豆包多模态任务、长文本处理图文/音乐生成、分布式TokenKimi中文场景协作文档处理、团队办公优化秘塔AI学术研究学术搜索、思维导图生成通义千问多语言多模态支持跨模态理解、逻辑推理文心一言智能搜索与推荐实时更新、自然语言理解结论学术研究 → 秘塔AI中文办公协作 → Kimi多模态创作 → 豆包/通义千问智能搜索 → 文心一言通用问答 → 智谱清言ℹ️。
2025-06-11 11:52:36
556
原创 python将数据写入excel中
这个直接用write形成csv的方法虽然便利,但是有一个缺点就是万一元素里面有英文逗号,但是你还要写进一个单元格的时候,就不行了。最近总能碰见将数据写入excel中,对这个着实不熟悉,每次使用都要现搜,有的还涉及到pandas(数据分析有需要这个库的)是一个 Python 库,用于读写 Excel 2010 及以上版本的 xlsx/xlsm/xltx/xltm 文件。然后又得搜open这个第二个参数的w,a是啥意思,有的覆盖,有的可以自行创建文件等等,
2024-06-10 10:21:12
457
原创 爬虫报错raise JSONDecodeError(“Expecting value“, s, err.value) from None json.decoder.JSONDecodeError:
是因为requests获取的数据不是json格式,而不是因为requests返回的值是None。File “D:/py_practice/第3部分.py”, line 57, in。这是requests进行多进程,由于无法获取网页源码,所以出现这种错误。
2024-04-20 16:58:02
828
原创 只替换中括号之间的逗号,该怎么办
先找到[],会生成一个列表,把里面的逗号替换,然后把相应的位置用{}替换,之后format(*all)替换。ok = no.format(*all) # 列表拆分,逐个填入{}i = sr[i].replace(‘,’, ‘、’) # 替换。]”, ‘{}’, s) # 将整个中括号替换为{}s = input(‘请输入要替换逗号的字符串:’)print(‘替换如下:%s’ % ok)“”“中括号内逗号替换为顿号”“”]“, s) # 查找中括号。只替换中括号之间的逗号。
2024-04-06 15:49:40
353
原创 Joplin配合teracloud进行多版本客户端分别笔记同步
所以当时想着重新建teracloud账号,操作之前想想就复杂,后来摸索了一阵子,发现用一个账户就可以了,只需要修改一下子路径即可。配置文件版本: 41),不支持思维导图,所以打算更新客户端版本,但是之前踩过坑,同步版本不一样的话,会导致手机和电脑无法同步,,里面有一个思维导图的插件我还是蛮喜欢的,结果下载后安装发现,我当前的Jopin的版本如下。这样,每个同步信息在各自的文件夹下,互不干扰,省去了建账号的麻烦步骤。最近瞎搜索joplin,意外在github上搜到plugins,
2024-01-06 09:38:18
723
原创 go get -u -v github.com/go-delve/delve/cmd/dlv失败
verifying github.com/gorilla/[email protected]/go.mod: github.com/gorilla/[email protected]/go.mod: Get https://sum.golang.org/lookup/github.com/gorilla/[email protected]: dial tcp 172.217.24.17:443: connectex: A connection attempt failed because the connect
2022-04-11 21:21:02
2899
原创 将游戏里面的图片提取RPGMVP / PNG_ Files
Petschkos RPG-Maker MV & MZ-File Decrypterhttps://petschko.org/tools/mv_decrypter/#restore-images
2021-12-24 10:56:37
29735
转载 网页结构举例
前段时间,黄同学为大家写了一篇爬虫保姆级文章,大家非常喜欢。链接如下: 3000字 “婴儿级” 爬虫图文教学 | 手把手教你用Python爬取 “实习网”! 这篇文章其实已经是基础的基础了,但是如果搭配上今天的这篇文章,应该更棒了! 今天黄同学就手把手带你认识...
2021-12-21 08:55:15
379
转载 Top20網頁爬蟲工具—5分鐘獲取網站數據
繁体字转简体字可以通过变成mobi文件,通过calibre进行转换网页爬虫(也称为数据提取,数据采集,数据爬虫)如今已广泛应用于许多领域。在没有网络爬虫工具出现之前,对于没有编程技能的普通人来说,它是一个神奇的词,它的高门槛不断将人们挡在大数据之门之外。但是网页抓取工具是一种自动数据抓取技术,通过自动化的爬取数据减少手动複制粘贴的繁琐步骤,拉近了我们与数据的距离。使用网络抓取工具有什么好处?它使您无需进行重複的複制和粘贴工作。它将提取的数据放入结构良好的格式中,包括但不限于Excel,HTML和CS
2021-12-21 08:26:16
2521
转载 有趣的Linux 命令
19 个恶搞 Linux 命令1. sl 命令你会看到一辆火车从屏幕右边开往左边……安装:$ sudo apt-get install sl运行:$ sl命令有 -a l F e 几个选项:-a An accident seems to happen. You'll feel pity for people who cry for help.-l shows little one.-F It flies.-e Allow interrupt by Ctrl+C.可以给别人来个恶作剧,他一敲 ls,不知道的肯
2021-12-13 20:36:19
259
转载 分支的新建与合并
Git 分支 - 分支的新建与合并 分支的新建与合并让我们来看一个简单的分支新建与分支合并的例子,实际工作中你可能会用到类似的工作流。你将经历如下步骤:开发某个网站。为实现某个新的用户需求,创建一个分支。在这个分支上开展工作。正在此时,你突然接到一个电话说有个很严重的问题需要紧急修补。你将按照如下方式来处理:切换到你的线上分支(production branch)。为这个紧急任务新建一个分支,并在其中修复它。在测试通过之后,切换回...
2021-12-13 15:50:39
840
转载 git 本地与远程仓库出现代码冲突解决方法
提交过程中报错:[python@heaven-00 Selesystem]$ git push -u origin masterUsername for ‘https://github.com’: sdfasnamePassword for ‘https://[email protected]’:To https://github.com/nighttidesy/-Selesystem.git! [rejected] master -> master (fetch first)e
2021-12-13 15:04:29
1270
转载 Python 并发编程 (守护进程, 进程同步(multiprocessing.Lock、Semaphore、Event)
Python并发编程 (守护进程, 进程同步(multiprocessing.Lock、Semaphore、Event) 进程间通信Queue)
2021-12-03 23:22:13
2195
转载 Linux —— 时间(tzselect、timedatactl命令,查看和修改时区,修改时区为东八区)
按照Linux —— 时间(tzselect、timedatactl命令,查看和修改时区,修改时区为东八区)步骤做的,不过TZ='Asia/Shanghai'; export TZ是在/etc/profile文件中添加的。vim /etc/profilesource /etc/profilesource通常用于重新执行刚修改的初始化文件,使之立即生效,而不必注销并重新登录。例如,当我们修改了/etc/profile文件,并想让它立刻生效,而不用重新登录,就可以使用source命令,如“sour
2021-11-24 20:02:10
638
1
原创 postman,10秒钟让你解决爬虫get问题,再也不为请求头而烦恼
首先进入你要爬取的网站,F12或者ctrl+shift+c上图刷新一下,复制curl然后打开postman便会出现各类的请求代码。这里我选择python的,
2021-11-17 11:12:39
954
LimitUseTimesDemo(c#).zip
2021-11-03
使用git传输文件和用qq传输,哪个费流量?
2021-11-12
TA创建的收藏夹 TA关注的收藏夹
TA关注的人