
python、rpa自动化
放弃治疗
reb0rn初代
弃疗吧
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
excel数据转换、文件移动(剪切、复制、删除)
# encoding=utf-8# 函数调用import tracebackimport os, xlrd, timefrom xlrd import xldate_as_tuplefrom datetime import datetimeimport datetimefrom xlutils.copy import copyimport pandas as pddef open_excel(file, encode=None): print("excel open_exce.原创 2022-02-08 16:51:10 · 687 阅读 · 0 评论 -
PDF按页拆分为PDF单页或者图片
import base64import sysimport PyPDF2import fitz, os, datetimedef pdf_split(file_path, out_dir): """ 单个pdf按页拆分pdf @param file_path: 源文件路径(绝对路径) @param out_dir: 输出pdf目录文件夹(绝对) @return: 输出文件目录文件夹(绝对) """ pdf_file = open(file.原创 2021-08-10 10:09:49 · 694 阅读 · 0 评论 -
json.decoder.JSONDecodeError: Expecting property name enclosed in double quotes: line 1 column 2
r = requests.post(url, files=files) # 上传文件print(r.text)r_ = r.json()在得到requests的返回结果之后,将结果转为json出现以下错误:json.decoder.JSONDecodeError: Expecting property name enclosed in double quotes: line 1 column 2 (char 1)原因:返回结果中是单引号,比如:{'code': 200, 'msg':.原创 2021-08-09 15:45:55 · 407 阅读 · 0 评论 -
certificate verify failed:self signed certificate in certificate chain(_ssl.c:1076)
向服务器发送请求时报以下错误:ssl.SSLCertVerificationError:[SSL:CERTIFICATE_VERIFY_FAILED] certificate verify failed:self signed certificate in certificate chain(_ssl.c:1076)原创 2021-04-02 19:44:21 · 7714 阅读 · 1 评论 -
django2+django-celery-beat2.0+celery4.4实现任务的动态添加等、多台机器分布式部署
qq环境说明:win10 celery==4.4.2 分布式任务队列、实现异步与定时 Django==2.2.5 django-celery-beat==2.0.0 实现定时任务的动态操作(添加/删除)等,此插件本质是对数据库表变化做检查,一旦有数 据库表改变,调度器重新读取任务进行调度 eventlet==0.25....原创 2020-06-28 16:40:51 · 2345 阅读 · 4 评论 -
远程桌面连接方式造成键盘鼠标失效(UI自动化)
winserver 2012 2016一、初识鼠标键盘失效问题当用户在一段时间内没有对Windows进行任何操作,Windwos会自动切换到锁屏模式(或屏保模式),甚至待机。对于普通用户来说,这样设置没问题,而且这也是官方推荐的设置。但如果这台电脑是IT开发人员用来进行自动化测试的机器,尤其是包含UI交互的测试(比如,用脚本操控鼠标来模拟点击一个按钮),这样设置就是错误的,因为退出桌面后,鼠标键盘会失效,UI自动化无法正常进行。解决这一问题思路很简单:保持计算机一直在桌面上。具体实施的方法如下:原创 2021-03-12 14:55:21 · 11545 阅读 · 0 评论 -
python从含有汉字和数字的字符串中提取数字部分
问题:从字符串“1小时12分钟”中(其中两个数字是变化的)截取出1和12.或者说“共12页”截取出12切片的方法比较简单,但不适合变化的字符串。filter(str.isdigit,"1小时12分钟")返回的列表是:['1','1','2']注,该方法在python2是直接返回列表,而在python3中返回的是filter对象,需要将其转换成list,方法是:list(filter(str.isdigit,"1小时12分钟"))正确的方法是:import rere.findall(r原创 2020-10-20 16:13:03 · 2389 阅读 · 0 评论 -
error(0, ‘SetForegroundWindow‘, ‘No error message is available‘)
import pythoncom........# 设置窗口最前端代码部分hld = win32gui.FindWindow(None, u"xxxxxxx标题") if hld <= 0: hld = win32gui.FindWindow(None, u"xxxxx标题") if hld > 0: # 设置为最前端窗口 win32gui....原创 2020-10-20 11:26:57 · 8018 阅读 · 4 评论 -
com_error(-2147221008, ‘尚未调用 CoInitialize。‘, None, None)
import pythoncompythoncom.CoInitialize()如果设置窗口最前端出错加在Dispatch前面一句原创 2020-10-20 11:10:27 · 986 阅读 · 2 评论 -
rpa自动化-selenium记录
一、常用库导入1.from selenium import webdriver 导入webdriver模块2.from selenium.webdriver import ActionChains 导入动作链类,动作链可以储存鼠标的动作,并一起执行3.from selenium.webdriver.common.key import Key 键盘操作使用的是Keys类,一般配合send_keys使用4.from selenium.webdriver.support.select impor原创 2020-09-09 13:43:44 · 671 阅读 · 0 评论 -
python爬虫之Scrapy框架原理及操作实例详解、股票数据Scrapy爬虫
爬虫框架-scrapy、pyspider、crawley等Scrapy框架1、scrapy框架介绍 -https://doc.scrapy.org/en/latest/ -http://scrapy-chs.readthedocs.io/zh_CN/latest/index.html-安装:利用pip或conda2、scrapy概述及原理...原创 2019-04-19 17:14:10 · 844 阅读 · 0 评论 -
python爬虫之验证码识别及TesseractNotFoundError:tesseract is not installed or it's not in your path问题解决
验证码问题1、验证码:放置机器人或者爬虫2、分类-简单图片-极验,官网:www.geeetest.com-12306-电话-google验证3、验证码破解-运用方法: -下载网页和验证码 -手动输入验证号码-简单图片 -使用图像识别软件或者文字识别软件 -可以使用第三方图像验证码破解网站...原创 2019-04-17 21:13:43 · 653 阅读 · 0 评论 -
python爬虫之动态HTML、Selenium详解、Selenium3.141+PhantomJS / chrome / firefox66+webdriver / gecodriver配置问题全解
动态HTML1、爬虫与反爬虫俱进~2、动态HTML介绍-JavaScript-jQuery-Ajax-DHTML-Python采集动态数据 -从Javascript代码入手采集 -Python第三方库运行JavaScript,直接采集在浏览器看到的页面3、Selenium + PhantomJS(1)Selenium:WE...原创 2019-04-17 18:33:14 · 1038 阅读 · 0 评论 -
python爬虫之Requests
Requests-HTTP for Humans更简洁更友好-继承了urllib的所有特征-底层使用的是urllib3-开源地址:https://github.com/requests/requests-中文文档:http://docs.python-requests.org/zh_CN/latest/iindex.html-安装:conda install request...原创 2019-04-14 22:26:42 · 194 阅读 · 0 评论 -
python爬虫之数据提取、正则表达式、xml、XPath、etree、CSS选择器 BeautifulSoup4
1、页面解析和数据提取简介(1)结构数据:先有的结构,再谈数据 -JSON文件 -JSON Path -转换成python类型进行操作(json类) -XML文件 -转换成python类型(xmltodict) -XPath ...原创 2019-04-16 18:35:56 · 11463 阅读 · 0 评论 -
Python爬虫之UserAgent和常见浏览器UA值总结、Proxy代理IP、隐藏地址
-UserAgent -UserAgent:用户代理,简称UA,属于heads的一部分,服务器通过UA来判断访问者身份 -常见的UA值,使用的时候可以直接复制粘贴,也可以用浏览器访问的时候抓包windows10 下各浏览器userAgent浏览器 userAgentChrome Mozilla/5.0 (Windows NT 10.0...原创 2019-04-08 21:17:03 · 4443 阅读 · 0 评论 -
python爬虫之使用cookie爬取登录后的界面、使用cookieFileJar保存cookie文件、cookie读取
1、cookie & session简介-由于http协议的无记忆性,人们为了弥补这个这个缺憾,所采用的一个补充协议-cookie是发放给用户(即http浏览器)的一段信息(通常记录用户身份),session是保存在服务器上的对应的另一半信息,用来记录用户信息(1)cookie和session的区别-存放位置不同-cookie不安全-session会保存在服务器上一...原创 2019-04-09 22:46:06 · 1070 阅读 · 0 评论 -
python爬虫之SSL、加密、破解有道词典加密算法并编写有道词典实时翻译
1、SSL-SSL证书就是指遵守SSL安全套阶层协议的服务器数字证书(SercureSocketLayer)-美国王景公司开发-CA(CertifacateAuthority)是数字证书认证中心,是发放、管理、废除数字证书的收信人的第三方机构-遇到不信任的SSL证书,需要单独处理解决以下错误:错误1:AttributeError: 'module' object has n...原创 2019-04-10 22:13:52 · 1143 阅读 · 0 评论