apscheduler.schedulers

from apscheduler.schedulers.background import BackgroundScheduler ModuleNotFoundError: No module named 'apscheduler.schedulers.background'

这个错误提示说明你没有安装名为 APScheduler 的 Python 包，你可以通过以下命令使用 pip 安装： pip install apscheduler ...安装完成后，你应该可以成功导入 apscheduler.schedulers.background 模块了。

python 中 apscheduler.schedulers.blocking如何安装

APScheduler是一个强大的任务调度库，而APScheduler.schedulers.blocking模块是指它的阻塞模式，它允许在主线程内处理调度任务。APScheduler本身通常是通过Python的包管理系统pip来安装的。如果你想在Python...

from apscheduler.schedulers.blocking import BlockingScheduler 介绍一下，具体举例说明

from apscheduler.schedulers.blocking import BlockingScheduler 这句话是在Python中引入阻塞式调度器（BlockingScheduler），它是APScheduler库的一部分。APScheduler是一个强大的任务调度框架，用于定期执行...

from scrapy import cmdline from apscheduler.schedulers.blocking import BlockingScheduler sched = BlockingScheduler() from scrapy.crawler import CrawlerProcess from scrapy.utils.project import get_project_settings def fun_min(): cmdline.execute('scrapy crawl xin'.split()) fun_min() sched.add_job(fun_min, 'interval', hours=10) sched.start() 这段代码是什么意思

这段代码是一个 Python 脚本，用于定时运行 Scrapy 爬虫。首先，导入了所需的模块和类。cmdline 模块用于执行 Scrapy 命令，BlockingScheduler 类用于创建一个阻塞式的调度器。CrawlerProcess 类用于创建一...

修正以下代码 from threading import Thread from apscheduler.schedulers.blocking import BlockingScheduler blocking = BlockingScheduler() def day_cron(func): """每天定时执行""" blocking.add_job(func, 'interval', seconds=5) blocking.start() a = True b = True c = True def a1(): print(a) t_1 = Thread(target=day_cron, args=('day_cron', a1,)) t_1.start()

from apscheduler.schedulers.blocking import BlockingScheduler blocking = BlockingScheduler() def day_cron(func): """每天定时执行""" blocking.add_job(func, 'interval', seconds=5) blocking.start()...

#定时任务：（任意APP下的views.py下或者urls.py下） from apscheduler.schedulers.background import BackgroundScheduler from django_apscheduler.jobstores import DjangoJobStore, register_job from apps.intelligent_draw.models import Machines from datetime import datetime, timedelta from utils.const import AllConsts from django.core.mail import send_mail #将已经过时的工作都删除 __lt小于 # from django_apscheduler.models import DjangoJob # DjangoJob.objects.filter(next_run_time__lte=datetime.now()).delete() # 将数据库中已经过时的工作删除 # 开启定时配置 # 实例化调度器 scheduler = BackgroundScheduler() # 调度器使用默认的DjangoJobStore() scheduler.add_jobstore(DjangoJobStore(), 'default') # trigger: 任务执行的方式，共有三种：'date':一次性任务、'interval'：循环任务、'cron'：定时任务。 # @register_job(scheduler, 'cron', day_of_week='mon-fri', hour='9', minute='30', second='10',id='task_test') #注册一个定时任务（replace_existing：重新启动时替换现有作业；防止id冲突报错） # 新增一个定时任务，每隔5分钟检测一次，如果发现机器的last_updated比现在的时间晚了半个小时，则更新机器状态为异常，并且发送一封邮件进行告警。 @register_job(scheduler, 'cron', minute='*/5', id='job', replace_existing=True) # 这里写你要执行的任务 def job_task(): print("定时任务开始：") half_hour_ago = datetime.now() - timedelta(minutes=30) machines = Machines.objects.filter(last_updated__lte=half_hour_ago) machine_list = [] for machine in machines: machine_list.append(machine.id) machines.update(status=AllConsts.MACHINE_STATUS_ILLEGAL) send_mail('邮件标题', '邮件内容', '[email protected]', ['[email protected]', '[email protected]']) # 定时任务开始 scheduler.start()这段代码有没有什么问题？

from apscheduler.schedulers.background import BackgroundScheduler from django_apscheduler.jobstores import DjangoJobStore scheduler = BackgroundScheduler() scheduler.add_jobstore(DjangoJobStore()...

所以报错这样是正常的对吗from apscheduler.schedulers.blocking import BlockingScheduler from apscheduler.events import EVENT_JOB_EXECUTED, EVENT_JOB_ERROR import datetime import logging logging.basicConfig(level=logging.INFO, format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s', datefmt='%Y-%m-%d %:H%M%S', filename='log1.txt', filemode='a') logging.FileHandler(encoding='utf-8', filename='log1.txt') def aps_test(x): print(datetime.datetime.now().strftime('%Y-%m-%d %:H%M%S'), x) def date_test(x): print(datetime.datetime.now().strftime('%Y-%m-%d %:H%M%S'), x) print(1/0) def my_listener(event): if event.exception: print('出错？？？？？？') else: print('正常///////////') scheduler = BlockingScheduler() scheduler.add_job(func=date_test, args=('一次性出错任务',), next_run_time=datetime.datetime.now()+datetime.timedelta(seconds=15), id='date_task') scheduler.add_job(func=aps_test, args=('循环任务',), trigger='interval', seconds=3, id='interval_task') scheduler.add_listener(my_listener, EVENT_JOB_EXECUTED | EVENT_JOB_ERROR) scheduler._logger=logging scheduler.start()

from apscheduler.schedulers.blocking import BlockingScheduler from apscheduler.events import EVENT_JOB_EXECUTED, EVENT_JOB_ERROR import datetime import logging logging.basicConfig(level=logging.INFO,...

SCHEDULER_CONFIG = { "apscheduler.jobstores.default": { "class": "django_apscheduler.jobstores:DjangoJobStore" }, 'apscheduler.executors.processpool': { "type": "threadpool" }, 'apscheduler.job_defaults.coalesce': 'false', 'apscheduler.job_defaults.max_instances': 10, 'apscheduler.job_defaults.misfire_grace_time': 300, }

from apscheduler.schedulers.background import BackgroundScheduler from apscheduler.jobstores.django import DjangoJobStore # 关键依赖 SCHEDULER_CONFIG = { # 1. 作业存储器配置 'jobstores': { '...

from django.apps import AppConfig class HrunnerConfig(AppConfig): default_auto_field = "django.db.models.BigAutoField" name = "hrunner" def ready(self): # 仅在应用加载完成后初始化调度器 if not hasattr(self, 'scheduler_started'): from .task import scheduler # 导入当前应用的调度器 # 启动调度器 scheduler.start() self.scheduler_started = True 另一个文件如下# tasks.py from apscheduler.schedulers.background import BackgroundScheduler from django_apscheduler.jobstores import DjangoJobStore # 初始化调度器 scheduler = BackgroundScheduler() scheduler.add_jobstore(DjangoJobStore(), "default") # --- 定义定时任务函数 --- def cleanup_temp_data(): print("清理临时数据...") def send_daily_report(): print("发送日报...") # --- 将任务添加到调度器 --- scheduler.add_job( cleanup_temp_data, "interval", # 间隔性任务 seconds=10, # 每隔 60 秒执行一次 # days=1, # 每天执行一次 id="cleanup_job", # replace_existing=True, # 允许覆盖同名任务 (即数据库已有id为 cleanup_job，不添加这个就会报错) ) scheduler.add_job( send_daily_report, "cron", # 定时任务（类似 crontab） hour=10, # 每天 9 点执行 minute=26, # 加了这行就表示，每天9点 10 分钟 id="report_job", # replace_existing=True, # 允许覆盖同名任务 ) # 注意：这里暂时不启动调度器！在 apps.py 中启动。 # 启动调度器 (这里也启动不了呢) # scheduler.start() 此时数据库里，没有任务，你看看为什么我启动后，会提示我'Job identifier (cleanup_job) conflicts with an existing job'

from apscheduler.schedulers.background import BackgroundScheduler scheduler = BackgroundScheduler() # 方式1：使用装饰器注册任务时覆盖 @register_job(scheduler, 'interval', hours=1, id='cleanup_job', ...

此代码执行后就直接结束了from analysis import CC from datetime import datetime, timedelta import schedule from apscheduler.schedulers.background import BackgroundScheduler from apscheduler.triggers.cron import CronTrigger import multiprocessing as mp import time def cc_job(): # 获取当天日期 date_today = datetime.today().strftime('%Y%m%d') # 获取当前时间 now_time = datetime.now().time().strftime('%H:%M:%S') # 获取1小时前整点开始时间 one_hour_ago_start = (datetime.now() - timedelta(hours=1)).time().strftime('%H:00:00') # one_hour_ago_start = (datetime.now() - timedelta(hours=1)).time().strftime('%H:%M:%S') # 获取1小时前整点结束时间 one_hour_ago_end = (datetime.now() - timedelta(hours=1)).time().strftime('%H:59:59') # one_hour_ago_end = (datetime.now() - timedelta(hours=1)).time().strftime('%H:%M:%S') # print(one_hour_ago_start) # print(one_hour_ago_end) cc = CC(one_hour_ago_start, one_hour_ago_end, date=date_today) cc.wesocket_connect_new() def run(): schedule.every().hour.at(":39").do(cc_job) schedule.run_pending() # time.sleep(60) if name == 'main': # # p = mp.Process(target=run) # p.start() scheduler = BackgroundScheduler() trigger = CronTrigger(hour='*', minute='05', second='10') scheduler.add_job(cc_job, trigger=trigger) scheduler.start()

这段代码定义了一个cc_job函数，该函数会在每小时的39分执行。接下来，代码创建了一个后台任务调度器，使用CronTrigger在每小时的第5分10秒执行cc_job函数。最后，调用scheduler.start()方法启动调度器。...

ModuleNotFoundError: No module named 'apscheduler.jobstores.django'

from apscheduler.schedulers.background import BackgroundScheduler from django.conf import settings import os def start(): if not settings.configured: os.environ.setdefault('DJANGO_SETTINGS_MODULE'...

import os import sys import json import logging import time from apscheduler.schedulers.background import BackgroundScheduler from multiprocessing import cpu_count, Pool BASE_DIR = os.path.dirname(os.path.dirname(os.path.abspath(file))) sys.path.insert(0, BASE_DIR) os.environ.setdefault("DJANGO_SETTINGS_MODULE", "teachingReform.settings") import django django.setup() from data_platform_integration.tasks import fetch_and_save_data, init_global_token, load_config logging.basicConfig( level=logging.INFO, format='%(asctime)s [%(levelname)s] %(message)s', handlers=[ logging.FileHandler("logs/sync.log"), logging.StreamHandler() ] ) logger = logging.getLogger(name) # def start_sync_process(table_info): # api_url = table_info.get('api_url') # model_class_name = table_info.get('model_class') # if not api_url or not model_class_name: # logger.warning(f"[-] 配置不完整，跳过表: {table_info}") # return # logger.info(f"[+] 开始处理表: {model_class_name}, API URL: {api_url}") # fetch_and_save_data(api_url, model_class_name, table_info) # logger.info(f"[+] 表 {model_class_name} 处理完成。") def start_sync_process(table_info): # 子进程中重新 setup Django 环境 import os import django os.environ.setdefault("DJANGO_SETTINGS_MODULE", "teachingReform.settings") django.setup() api_url = table_info.get('api_url') model_class_name = table_info.get('model_class') if not api_url or not model_class_name: logger.warning(f"[-] 配置不完整，跳过表: {table_info}") return logger.info(f"[+] 开始处理表: {model_class_name}, API URL: {api_url}") fetch_and_save_data(api_url, model_class_name, table_info) logger.info(f"[+] 表 {model_class_name} 处理完成。") def run_once_immediately(): config = load_config() logger.info("[+] 开始立即执行一次任务...") # 初始化全局 token cached_token = '' cached_expires_at = 0.0 init_global_token(cached_token, cached_expires_at) # 获取所有 enabled 表 tables = config.get('tables', []) filtered_tables = [t for t in tables if t.get('enabled', True)] # 按 last_page 降序排序，页数越大的排前面 sorted_tables = sorted( filtered_tables, key=lambda x: x.get("last_page", 1), reverse=True ) MAX_CONCURRENT_WORKERS = 3 # 固定最大并发数 max_workers = min(MAX_CONCURRENT_WORKERS, cpu_count(), len(sorted_tables)) logger.info(f"[+] 使用 {max_workers} 个工作进程来处理 {len(sorted_tables)} 个表。") with Pool(processes=max_workers) as pool: pool.map(start_sync_process, sorted_tables) # 使用排好序的列表 logger.info("[+] 立即执行任务已完成。") def main(): # 启动定时任务 config = load_config() scheduler = BackgroundScheduler() # 初始化全局 token cached_token = '' cached_expires_at = 0.0 init_global_token(cached_token, cached_expires_at) # 获取所有 enabled 表 tables = config.get('tables', []) filtered_tables = [t for t in tables if t.get('enabled', True)] # 按 last_page 降序排序，页数越大的排前面 sorted_tables = sorted( filtered_tables, key=lambda x: x.get("last_page", 1), reverse=True ) for table_info in sorted_tables: # ✅ 使用排序后的表列表 api_url = table_info.get('api_url') model_class = table_info.get('model_class') if not api_url or not model_class: logger.warning(f"[-] 配置不完整，跳过定时任务: {table_info}") continue job_id = f"sync_{model_class}" if scheduler.get_job(job_id): logger.warning(f"[!] 已存在任务 {job_id}，跳过添加。") else: scheduler.add_job( fetch_and_save_data, 'interval', hours=48, args=[api_url, model_class, table_info], id=job_id, misfire_grace_time=30, coalesce=True, max_instances=1 ) logger.info(f"[+] 定时任务 {job_id} 已添加。") scheduler.start() logger.info("[+] 定时任务已启动，按 Ctrl+C 停止程序...") # 确保立即执行任务被调用 run_once_immediately() try: while True: time.sleep(1) except KeyboardInterrupt: scheduler.shutdown() logger.info("[-] 程序已终止。") if name == "main": main()

我们有一个Python程序，它使用APScheduler设置定时任务，并使用多进程池（multiprocessing.Pool）来并行处理多个数据表的同步任务。程序的主要功能是：1.加载配置，配置中包含多个需要同步的表的信息（APIURL、对应...

PyPI 官网下载 | APScheduler-3.6.2.tar.gz

2. **导入库**：在 Python 代码中引入所需模块，如 from apscheduler.schedulers.blocking import BlockingScheduler。 3. **创建调度器**：实例化调度器对象，如 scheduler = BlockingScheduler()。 4. **...

# -- coding: UTF-8 -- import logging from datetime import datetime import cx_Oracle import numpy as np import requests from pymilvus import connections, Collection, utility, CollectionSchema, FieldSchema, DataType, MilvusException from apscheduler.schedulers.background import BackgroundScheduler import time import re import sys import os from pathlib import Path import json # 获取当前脚本的父目录（即项目根目录） current_dir = os.path.dirname(os.path.dirname(os.path.abspath(file))) sys.path.append(str(current_dir)) # 将项目根目录添加到 sys.path from config.config1 import LOGGING_CONFIG, ORACLE_CONFIG, MODEL_CONFIG, MILVUS_CONFIG # 初始化日志 log_file_path = LOGGING_CONFIG["log_file"] log_file_path = Path(log_file_path) log_file_path.parent.mkdir(exist_ok=True) logging.basicConfig( level=LOGGING_CONFIG["level"], format="%(asctime)s - %(levelname)s - %(message)s", handlers=[ logging.FileHandler(log_file_path), logging.StreamHandler() ] ) logger = logging.getLogger("MaterialSync") class OracleClient: """Oracle数据库客户端""" def init(self): self.conn = None self.connect() def connect(self): try: self.conn = cx_Oracle.connect('ecology/[email protected]/oadb', encoding='UTF-8', nencoding='UTF-8') # 指定编码 logger.info("Connected to Oracle database") except Exception as e: logger.error(f"Oracle connection failed: {str(e)}") raise def fetch_all_data(self): """从Oracle数据库中获取所有数据""" try: cursor = self.conn.cursor() query = """ SELECT TO_CHAR(matnr) AS matnr, TO_CHAR(matkl) AS matkl, TO_CHAR(maktx) AS maktx, TO_CHAR(classfication) AS classfication FROM Material_MASTER@ERPLINK WHERE mandt = '688' AND ( matnr like 'DJ%' OR matnr like 'DY%' ) ORDER BY matnr """ cursor.execute(query) columns = [col[0].lower() for col in cursor.description] return [dict(zip(columns, row)) for row in cursor] except Exception as e: logger.error(f"Oracle query failed: {str(e)}") return [] finally: cursor.close() class VectorServiceClient: """HTTP调用模型服务进行向量编码""" def init(self): self.service_url = MODEL_CONFIG["model_service_url"] self.timeout = 120 # 请求超时时间（秒） logger.info(f"Using vector service: {self.service_url}") def batch_encode_dense(self, texts): """批量生成密集向量""" return self._call_vector_service(texts, "dense") def batch_encode_sparse(self, texts): """批量生成稀疏向量""" return self._call_vector_service(texts, "sparse") def _call_vector_service(self, texts, vector_type): """调用向量服务通用方法""" try: if not texts: return [] # 准备请求数据 payload = { "texts": texts, "type": vector_type # 添加向量类型参数 } # 配置请求头 headers = { "Content-Type": "application/json; charset=utf-8", "Accept": "application/json" } # 详细记录请求格式 logger.debug(f"Request payload details:") logger.debug(f" Vector type: {vector_type}") logger.debug(f" Text count: {len(texts)}") # 记录前3条文本的详细信息 for i, text in enumerate(texts[:3]): logger.debug(f" Text #{i + 1} (length={len(text)}): {text[:100]}{'...' if len(text) > 100 else ''}") # 记录整个请求体（限制长度） payload_json = json.dumps(payload, ensure_ascii=False) if len(payload_json) > 1000: logger.debug(f" Full request body (truncated): {payload_json[:1000]}...") else: logger.debug(f" Full request body: {payload_json}") # 发送请求到模型服务 response = requests.post( self.service_url, json=payload, headers=headers , timeout=self.timeout ) # 检查响应状态 response.raise_for_status() # 解析响应数据 result = response.json() if "error" in result: logger.error(f"Vector service error ({vector_type}): {result['error']}") raise ValueError(result["error"]) if "vectors" not in result: logger.error(f"Invalid response from {vector_type} service: vectors not found") logger.error(f"Response: {json.dumps(result, ensure_ascii=False)[:500]}") raise ValueError(f"Invalid response from {vector_type} service") logger.info(f"Successfully encoded {len(texts)} texts for {vector_type} vectors") # 对于密集向量，转换为numpy数组 if vector_type == "dense": vectors = np.array(result["vectors"]) # 验证向量维度 expected_dim = MILVUS_CONFIG["vector_dim"] if vectors.shape[1] != expected_dim: logger.error(f"Vector dimension mismatch: expected {expected_dim}, got {vectors.shape[1]}") raise ValueError("Vector dimension mismatch") return vectors else: # 稀疏向量直接返回字典列表 return result["vectors"] except requests.exceptions.RequestException as e: logger.error(f"Request to {vector_type} service failed: {str(e)}") raise except Exception as e: logger.error(f"Encoding via {vector_type} service failed: {str(e)}") raise class MilvusHandler: """Milvus数据库处理器""" def init(self): self.collection = None self.vector_service = VectorServiceClient() self.connect() self.prepare_collection() def connect(self): try: connections.connect( host=MILVUS_CONFIG["host"], port=MILVUS_CONFIG["port"] ) logger.info(f"Connected to Milvus: {MILVUS_CONFIG['host']}") except Exception as e: logger.error(f"Milvus connection failed: {str(e)}") raise def prepare_collection(self): """准备集合（自动创建）""" collection_name = MILVUS_CONFIG["collection_name"] if not utility.has_collection(collection_name): fields = [ FieldSchema(name="matnr", dtype=DataType.VARCHAR, is_primary=True, max_length=100), FieldSchema(name="matkl", dtype=DataType.VARCHAR, max_length=50), FieldSchema(name="maktx", dtype=DataType.VARCHAR, max_length=1024), FieldSchema(name="classfication", dtype=DataType.VARCHAR, max_length=1024), FieldSchema(name="maktx_vector", dtype=DataType.FLOAT_VECTOR, dim=MILVUS_CONFIG["vector_dim"]), FieldSchema(name="classfication_vector", dtype=DataType.SPARSE_FLOAT_VECTOR) ] schema = CollectionSchema(fields, "Material vector storage") self.collection = Collection(collection_name, schema) # 创建稀疏向量索引 self.collection.create_index( "classfication_vector", {"index_type": "SPARSE_INVERTED_INDEX", "metric_type": "IP"} ) # 创建密集向量索引 self.collection.create_index( "maktx_vector", {"index_type": "IVF_FLAT", "metric_type": "IP", "params": {"nlist": 1024}} ) logger.info(f"Created collection with both vector types: {collection_name}") else: self.collection = Collection(collection_name) logger.info(f"Loaded collection schema: {collection_name}") # 确保集合已加载 self.ensure_collection_loaded() def ensure_collection_loaded(self): """确保集合已加载到内存""" try: collection_name = self.collection.name load_state = utility.load_state(collection_name) # 检查集合是否已加载 if load_state != "Loaded": logger.info(f"Collection state is {load_state}, loading now...") self.collection.load() logger.info("Collection loaded successfully") else: logger.info(f"Collection is already loaded (state: {load_state})") except MilvusException as e: logger.error(f"Failed to load collection: {str(e)}") raise except Exception as e: logger.error(f"Error checking collection state: {str(e)}") # 如果无法检查状态，尝试直接加载 try: self.collection.load() logger.info("Collection loaded successfully (using fallback)") except Exception as e2: logger.error(f"Fallback loading failed: {str(e2)}") raise def batch_upsert(self, data, batch_size=500): """分批次插入或更新数据""" total_records = len(data) processed_count = 0 for i in range(0, total_records, batch_size): batch_data = data[i:i + batch_size] # 确保集合已加载 self.ensure_collection_loaded() # 数据清洗 valid_batch_data = [] for item in batch_data: try: cleaned_item = { "matnr": self.clean_utf8(item["matnr"], 'matnr', item['matnr']), "matkl": self.clean_utf8(item["matkl"], 'matkl', item['matnr']), "maktx": self.clean_utf8(item["maktx"], 'maktx', item['matnr']), "classfication": self.clean_utf8(item.get("classfication", ""), 'classfication', item['matnr']) } # 验证UTF-8 if all(self.validate_utf8_string(v) for k, v in cleaned_item.items()): valid_batch_data.append(cleaned_item) else: logger.warning(f"Invalid UTF-8 data skipped: {cleaned_item}") except Exception as e: logger.error(f"Error cleaning item: {str(e)}") if not valid_batch_data: logger.info(f"No valid data in batch {i // batch_size + 1}") continue logger.info(f"Processing batch {i // batch_size + 1} with {len(valid_batch_data)} items") # 查询当前批次中已存在的物料编码 matnr_list = [item['matnr'] for item in valid_batch_data] existing_data = [] try: # 构建安全的查询表达式 safe_matnrs = [f"'{matnr}'" for matnr in matnr_list] expr = f"matnr in [{','.join(safe_matnrs)}]" logger.debug(f"Querying Milvus with expression: {expr}") existing_data = self.collection.query( expr=expr, output_fields=["matnr", "maktx", "classfication", "maktx_vector", "classfication_vector"] ) logger.debug(f"Found {len(existing_data)} existing records") except MilvusException as e: logger.error(f"Milvus query failed: {str(e)}") # 回退方案：逐个查询 logger.warning("Falling back to individual queries") for matnr in matnr_list: try: expr = f"matnr == '{matnr}'" item_data = self.collection.query(expr, output_fields=["matnr", "maktx", "classfication", "maktx_vector", "classfication_vector"]) if item_data: existing_data.extend(item_data) except Exception as e: logger.error(f"Failed to query matnr {matnr}: {str(e)}") existing_dict = {item["matnr"]: item for item in existing_data} # 准备需要重新生成向量的数据 maktx_to_encode = [] # 需要生成密集向量的物料描述 class_to_encode = [] # 需要生成稀疏向量的特征值 maktx_indices = [] # 需要更新密集向量的索引 class_indices = [] # 需要更新稀疏向量的索引 # 准备upsert数据 upsert_data = [] for idx, item in enumerate(valid_batch_data): matnr = item["matnr"] existing = existing_dict.get(matnr, {}) # 检查物料描述是否变化 if matnr in existing_dict: if item["maktx"] == existing.get("maktx", ""): # 物料描述相同，复用现有向量 item["maktx_vector"] = existing.get("maktx_vector") else: # 物料描述变化，需要重新生成 maktx_to_encode.append(item["maktx"]) maktx_indices.append(idx) else: # 新记录，需要生成向量 maktx_to_encode.append(item["maktx"]) maktx_indices.append(idx) # 处理特征值向量 class_value = item["classfication"] # 特征值为空的情况 if not class_value or class_value.isspace(): item["classfication_vector"] = None else: # 特征值不为空 if matnr in existing_dict: if class_value == existing.get("classfication", ""): # 特征值相同，复用现有向量 item["classfication_vector"] = existing.get("classfication_vector") else: # 特征值变化，需要重新生成 class_to_encode.append(class_value) class_indices.append(idx) else: # 新记录，需要生成向量 class_to_encode.append(class_value) class_indices.append(idx) upsert_data.append(item) # 批量生成物料描述向量（密集） if maktx_to_encode: try: logger.info(f"Encoding {len(maktx_to_encode)} dense vectors for maktx...") dense_vectors = self.vector_service.batch_encode_dense(maktx_to_encode) # 将向量分配给对应的记录 for vec_idx, data_idx in enumerate(maktx_indices): upsert_data[data_idx]["maktx_vector"] = dense_vectors[vec_idx] except Exception as e: logger.error(f"Failed to encode dense vectors: {str(e)}") # 跳过这个批次 continue # 批量生成特征值向量（稀疏） if class_to_encode: try: logger.info(f"Encoding {len(class_to_encode)} sparse vectors for classfication...") sparse_vectors = self.vector_service.batch_encode_sparse(class_to_encode) # 将向量分配给对应的记录 for vec_idx, data_idx in enumerate(class_indices): # 确保索引在范围内 if vec_idx < len(sparse_vectors): upsert_data[data_idx]["classfication_vector"] = sparse_vectors[vec_idx] except Exception as e: logger.error(f"Failed to encode sparse vectors: {str(e)}") # 跳过这个批次 continue # 准备Milvus实体数据 entities = [ [item["matnr"] for item in upsert_data], [item["matkl"] for item in upsert_data], [item["maktx"] for item in upsert_data], [item["classfication"] for item in upsert_data], [item.get("maktx_vector", []).tolist() if hasattr(item.get("maktx_vector", None), 'tolist') else [] for item in upsert_data], [self.format_sparse_vector(item.get("classfication_vector")) for item in upsert_data] ] # 执行upsert操作 if upsert_data: try: logger.info(f"Upserting {len(upsert_data)} records to Milvus...") self.collection.upsert(entities) self.collection.flush() # 统计空特征值数量 empty_class_count = sum(1 for item in upsert_data if not item["classfication"] or item["classfication"].isspace()) logger.info(f"Upserted batch {i // batch_size + 1}: " f"{len(upsert_data)} records ({empty_class_count} empty classfication)") processed_count += len(upsert_data) except MilvusException as e: logger.error(f"Milvus upsert failed: {str(e)}") # 记录前3条失败数据 for j in range(min(3, len(upsert_data))): sample = upsert_data[j] logger.error(f"Failed sample {j + 1}: matnr={sample['matnr']}, " f"maktx_len={len(sample['maktx'])}, " f"class_len={len(sample['classfication']) if sample['classfication'] else 0}") return processed_count def format_sparse_vector(self, vec): """格式化稀疏向量为Milvus兼容格式""" if vec is None: return {} # FlagEmbedding 返回的是 {token: weight} 格式 if isinstance(vec, dict): # 转换为 {index: weight} 格式 # 这里我们不需要实际索引，只需确保键是整数 # 使用枚举创建新索引，因为原始token字符串Milvus无法处理 formatted = {} for idx, (token, weight) in enumerate(vec.items()): # 确保权重非负 if float(weight) > 0: formatted[int(idx)] = float(weight) return formatted # 如果传入的是列表或其他格式，转换为字典 try: if isinstance(vec, (list, tuple, np.ndarray)): # 转换为稀疏字典格式，只保留正值 return {i: float(val) for i, val in enumerate(vec) if float(val) > 0} return {} except Exception as e: logger.error(f"Failed to format sparse vector: {str(e)}") return {} @staticmethod def validate_utf8_string(s): try: s.encode('utf-8').decode('utf-8') return True except (UnicodeEncodeError, UnicodeDecodeError): return False @staticmethod def clean_utf8(value, field_name, item_id): """强化 UTF-8 清洗逻辑""" if value is None: return '' try: value_str = str(value) cleaned = re.sub(r'\\u[0-9a-fA-F]{4}', '', value_str) cleaned = cleaned.replace('\xa0', ' ') cleaned = cleaned.encode('utf-8', errors='replace').decode('utf-8') return cleaned except Exception as e: logger.warning(f"Failed to clean UTF-8 for [{field_name}] ({item_id}): {str(e)}") return '' class SyncScheduler: """同步调度器""" def init(self): self.oracle = OracleClient() self.milvus = MilvusHandler() def execute_sync(self): """执行同步任务""" logger.info("Starting sync job...") start_time = time.time() try: # 从Oracle获取所有数据 logger.info("Fetching data from Oracle...") all_data = self.oracle.fetch_all_data() if not all_data: logger.info("No data found in Oracle") return logger.info(f"Retrieved {len(all_data)} records from Oracle") # 数据校验和清理 cleaned_data = [] invalid_count = 0 empty_class_count = 0 for item in all_data: try: # 处理可能的键名变化 class_value = item.get('classfication', item.get('classfication', '')) # 数据清洗 cleaned_item = { "matnr": self.clean_utf8(item['matnr'], 'matnr', item['matnr']), "matkl": self.clean_utf8(item['matkl'], 'matkl', item['matnr']), "maktx": self.clean_utf8(item['maktx'], 'maktx', item['matnr']), "classfication": self.clean_utf8(class_value, 'classfication', item['matnr']) } # 统计空特征值 if not cleaned_item["classfication"] or cleaned_item["classfication"].isspace(): empty_class_count += 1 # 验证UTF-8 if all(self.is_valid_utf8(v) for v in cleaned_item.values()): cleaned_data.append(cleaned_item) else: invalid_count += 1 logger.warning(f"Invalid UTF-8 data skipped: matnr={item['matnr']}") except Exception as e: invalid_count += 1 logger.error(f"Error processing item: {item}, error: {str(e)}") if invalid_count > 0: logger.warning(f"Skipped {invalid_count} invalid records") if cleaned_data: processed_count = self.milvus.batch_upsert(cleaned_data) logger.info(f"Successfully processed {processed_count}/{len(cleaned_data)} records") else: logger.warning("No valid data to sync") duration = time.time() - start_time logger.info(f"Sync job completed in {duration:.2f} seconds") except Exception as e: logger.error(f"Sync failed: {str(e)}") duration = time.time() - start_time logger.error(f"Sync job failed after {duration:.2f} seconds") # 尝试重新连接Milvus try: logger.info("Attempting to reconnect to Milvus...") self.milvus = MilvusHandler() logger.info("Milvus reconnected successfully") except Exception as reconnect_error: logger.error(f"Reconnection failed: {str(reconnect_error)}") @staticmethod def clean_utf8(value, field_name, item_id): """强化 UTF-8 清洗逻辑""" if value is None: return '' try: value_str = str(value) cleaned = re.sub(r'\\u[0-9a-fA-F]{4}', '', value_str) cleaned = cleaned.replace('\xa0', ' ') cleaned = cleaned.encode('utf-8', errors='replace').decode('utf-8') return cleaned except Exception as e: logger.warning(f"Failed to clean UTF-8 for [{field_name}] ({item_id}): {str(e)}") return '' @staticmethod def is_valid_utf8(s): try: s.encode('utf-8').decode('utf-8') return True except UnicodeError: return False if name == "main": scheduler = BackgroundScheduler() sync = SyncScheduler() # 立即执行一次同步 logger.info("Executing initial sync...") sync.execute_sync() # 每天凌晨2点执行 scheduler.add_job(sync.execute_sync, "cron", hour=10, minute=58) try: logger.info("Scheduler started with HTTP vector services") scheduler.start() # 保持主程序运行 while True: time.sleep(60) except (KeyboardInterrupt, SystemExit): logger.info("Scheduler stopped") scheduler.shutdown() except Exception as e: logger.error(f"Unexpected error: {str(e)}") import traceback logger.error(traceback.format_exc()) 这个代码报错2025-07-05 10:58:16,307 - ERROR - Request to dense service failed: 400 Client Error: Bad Request for url: http://10.162.244.27:8088/encode 2025-07-05 10:58:16,307 - ERROR - Failed to encode dense vectors: 400 Client Error: Bad Request for url: http://10.162.244.27:8088/encode

我们正在处理一个HTTP 400 Bad Request错误，该错误发生在向向量服务接口http://10.162.244.27:8088/encode发送请求时。...以下我们将逐步分析可能的原因和解决方法。 ### 步骤1: 检查请求的URL和端口 ...

import re import time import json import threading from selenium import webdriver from datetime import datetime, timedelta from selenium.webdriver.edge.service import Service as EdgeService from selenium.webdriver.edge.options import Options as EdgeOptions from selenium.webdriver.support.ui import WebDriverWait, Select from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.by import By from apscheduler.schedulers.background import BackgroundScheduler from pytz import timezone import FreeSimpleGUI as sg BEIJING_TZ = timezone('Asia/Shanghai') CONFIG_FILE = 'browser_config.json' ELEMENT_TYPES = { "按钮": "button", "复选框": "checkbox", "单选按钮": "radio", "下拉框": "dropdown", "标签页": "tab", "时间": "time", "文本": "text" } WEEKDAYS = ["周一", "周二", "周三", "周四", "周五", "周六", "周日"] SCHEDULER = None def load_config(): default_config = { "order": ["选项1", "选项2", "选项3", "选项4", "选项5", "选项6", "选项7"], "elements": { "target_url": "http://www.igs.gnsswhu.cn/index.php", "选项1": {"type": "标签页", "identifier": "OBS观测值"}, "选项2": {"type": "下拉框", "identifier": "IGS测站列表"}, "选项3": {"type": "复选框", "identifier": "ABMF00GLP"}, "选项4": {"type": "单选按钮", "identifier": "d文件"}, "选项5": {"type": "时间", "identifier": "开始时间"}, "选项6": {"type": "时间", "identifier": "结束时间"}, "选项7": {"type": "按钮", "identifier": "检索"}, }, "start_date": "", "end_date": "", "schedule": { "start_preset": "--", "end_preset": "--", "schedule_type": "--", "schedule_time": "00:00:00" }, "stay_duration": 60 } try: with open(CONFIG_FILE, 'r') as f: user_config = json.load(f) merged_config = default_config.copy() merged_config.update(user_config) # 用户配置覆盖默认 merged_config['order'] = user_config.get('order', default_config['order']) # 确保顺序正确 # 处理日期格式 if 'start_date' in merged_config and ' ' not in merged_config.get('start_date', ''): merged_config['start_date'] += " 00:00:00" if 'end_date' in merged_config and ' ' not in merged_config.get('end_date', ''): merged_config['end_date'] += " 00:00:00" return merged_config except: return default_config def save_config(values, current_order): try: elements = {} for label in current_order: elements[label] = { "type": values[f'-{label}_TYPE-'], "identifier": values[f'-{label}_ID-'] } if values[f'-{label}_TYPE-'] == "文本": elements[label]["text"] = values[f'-{label}_TEXT-'] def get_full_datetime(date_str, h, m, s): if not date_str: return "" # 格式化为两位数 h = f"{int(h):02d}" if h else "00" m = f"{int(m):02d}" if m else "00" s = f"{int(s):02d}" if s else "00" return f"{date_str} {h}:{m}:{s}" start_time = get_full_datetime(values['-START_DATE-'], values['-START_HOUR-'], values['-START_MINUTE-'], values['-START_SECOND-']) end_time = get_full_datetime(values['-END_DATE-'], values['-END_HOUR-'], values['-END_MINUTE-'], values['-END_SECOND-']) config = { "order": current_order, "elements": { "target_url": values['-URL-'], elements }, "start_identifier": load_config().get('start_identifier', '开始时间'), "end_identifier": load_config().get('end_identifier', '结束时间'), "start_date": start_time, "end_date": end_time, "schedule": load_config().get('schedule', {}), "stay_duration": load_config().get('stay_duration', 60) } with open(CONFIG_FILE, 'w') as f: json.dump(config, f, ensure_ascii=False) return True except Exception as e: print(f"保存配置失败: {str(e)}") return False def create_element_row(label, element_type='', identifier='', text_value=''): return [ sg.Text(label, size=(12, 1)), sg.Combo( list(ELEMENT_TYPES.keys()), default_value=element_type, key=f'-{label}_TYPE-', size=(15, 1), enable_events=True ), sg.Input( identifier, key=f'-{label}_ID-', size=(20, 1) ), sg.Input( text_value, key=f'-{label}_TEXT-', size=(20, 1), visible=(element_type == "文本") ), sg.Button('↑', key=f'-{label}_UP-'), sg.Button('↓', key=f'-{label}_DOWN-'), sg.Button('-', key=f'-{label}_DEL-') ] def create_elements_column(current_order): config = load_config() elements = [] for label in current_order: element_config = config['elements'].get(label, {}) elements.append(create_element_row( label, element_config.get('type', ''), element_config.get('identifier', ''), element_config.get('text', '') )) return sg.Column( elements, scrollable=True, vertical_scroll_only=True, size=(800, 300), key='-ELEMENTS_COL-' ) def show_settings_window(parent_window): """显示停留时间设置窗口""" config = load_config() start_id = config.get('start_identifier', '开始时间') end_id = config.get('end_identifier', '结束时间') layout = [ [sg.Text('网页停留时间（秒）:'), sg.Input(config.get('stay_duration', 60), key='-STAY_DURATION-')], [sg.HorizontalSeparator()], [sg.Text('开始时间字段标识:'), sg.Input(start_id, key='-START_ID-', size=15)], [sg.Text('结束时间字段标识:'), sg.Input(end_id, key='-END_ID-', size=15)], [sg.Button('保存'), sg.Button('取消')] ] window = sg.Window('设置', layout, modal=True) while True: event, values = window.read() if event in (None, '取消'): break if event == '保存': try: stay_duration = int(values['-STAY_DURATION-']) if stay_duration <= 0: raise ValueError("停留时间必须大于0") config['stay_duration'] = stay_duration config['start_identifier'] = values['-START_ID-'].strip() config['end_identifier'] = values['-END_ID-'].strip() with open(CONFIG_FILE, 'w') as f: json.dump(config, f, ensure_ascii=False) sg.popup('设置已保存！') break except Exception as e: sg.popup_error(f'输入无效: {str(e)}') window.close() def create_gui(): config = load_config() current_order = config["order"].copy() elements_config = config["elements"] schedule_config = config.get('schedule', {}) # 时间处理函数 def split_datetime(dt_str): if not dt_str: return "", "00", "00", "00" if ' ' in dt_str: date_part, time_part = dt_str.split(' ', 1) h, m, s = time_part.split(':')[:3] else: date_part, h, m, s = dt_str, '00', '00', '00' return date_part, h, m, s # 初始化日期时间 start_date, start_h, start_m, start_s = split_datetime(config.get('start_date', '')) end_date, end_h, end_m, end_s = split_datetime(config.get('end_date', '')) # 主布局 layout = [ [sg.Text('目标网址'), sg.Input(config['elements']['target_url'], key='-URL-')], [sg.HorizontalSeparator()], [create_elements_column(current_order)], [sg.Button('+ 添加选项', key='-ADD_OPTION-')], [sg.HorizontalSeparator()], # 开始时间选择 [sg.Frame('开始时间', [ [sg.CalendarButton('选择日期', target='-START_DATE-', format='%Y-%m-%d'), sg.Input(start_date, key='-START_DATE-', size=(12, 1)), sg.Spin([f"{i:02}" for i in range(24)], start_h, key='-START_HOUR-', size=3), sg.Text(':'), sg.Spin([f"{i:02}" for i in range(60)], start_m, key='-START_MINUTE-', size=3), sg.Text(':'), sg.Spin([f"{i:02}" for i in range(60)], start_s, key='-START_SECOND-', size=3)] ])], # 结束时间选择 [sg.Frame('结束时间', [ [sg.CalendarButton('选择日期', target='-END_DATE-', format='%Y-%m-%d'), sg.Input(end_date, key='-END_DATE-', size=(12, 1)), sg.Spin([f"{i:02}" for i in range(24)], end_h, key='-END_HOUR-', size=3), sg.Text(':'), sg.Spin([f"{i:02}" for i in range(60)], end_m, key='-END_MINUTE-', size=3), sg.Text(':'), sg.Spin([f"{i:02}" for i in range(60)], end_s, key='-END_SECOND-', size=3)] ])], # 控制按钮 [sg.HorizontalSeparator()], [sg.Button('运行', size=10), sg.Button('定时', key='-SCHEDULE-', size=10), sg.Button('保存配置', size=10), sg.Button('设置', size=10), sg.Button('退出', size=10)], [sg.Output(size=(90, 10), echo_stdout_stderr=True, key='-OUTPUT-')] ] window = sg.Window('浏览器自动化工具', layout, finalize=True) setup_scheduler(window) # 动态更新元素可见性 def update_element_visibility(): for label in current_order: element_type = values.get(f'-{label}_TYPE-', '') window[f'-{label}_TEXT-'].update(visible=(element_type == "文本")) # 主事件循环 while True: event, values = window.read() if event in (None, '退出'): break # 元素类型变化事件 if '_TYPE-' in event: update_element_visibility() # 添加新选项 if event == '-ADD_OPTION-': new_label = f'选项{len(current_order) + 1}' current_order.append(new_label) window.extend_layout(window['-ELEMENTS_COL-'], [create_element_row(new_label)]) window['-ELEMENTS_COL-'].contents_changed() # 删除选项 if '_DEL-' in event: label = event.split('_')[1] if label in current_order: current_order.remove(label) # 删除对应的UI元素 for element in window['-ELEMENTS_COL-'].Widget.winfo_children(): if f'_{label}_' in str(element): element.destroy() # 重新编号剩余选项 new_order = [f"选项{i + 1}" for i in range(len(current_order))] config_changes = {} for old, new in zip(current_order, new_order): config_changes[old] = new # 更新配置和当前顺序 current_order = new_order.copy() window['-ELEMENTS_COL-'].update(visible=False) window['-ELEMENTS_COL-'].update(visible=True) # 移动选项位置 if '_UP-' in event or '_DOWN-' in event: direction = -1 if '_UP-' in event else 1 label = event.split('_')[1] index = current_order.index(label) new_index = index + direction if 0 <= new_index < len(current_order): # 交换顺序 current_order.insert(new_index, current_order.pop(index)) # 重新排列UI元素 elements = [create_element_row(lbl) for lbl in current_order] window['-ELEMENTS_COL-'].update(visible=False) window['-ELEMENTS_COL-'].update(elements) window['-ELEMENTS_COL-'].contents_changed() window['-ELEMENTS_COL-'].update(visible=True) # 保存配置 if event == '保存配置': elements = {} for label in current_order: elements[label] = { "type": values[f'-{label}_TYPE-'], "identifier": values[f'-{label}_ID-'] } if values[f'-{label}_TYPE-'] == "文本": elements[label]["text"] = values[f'-{label}_TEXT-'] # 构建时间字符串 def build_time_str(date_part, h, m, s): return f"{date_part} {h}:{m}:{s}" if date_part else "" new_config = { "order": current_order, "elements": { "target_url": values['-URL-'], elements }, "start_date": build_time_str( values['-START_DATE-'], values['-START_HOUR-'], values['-START_MINUTE-'], values['-START_SECOND-'] ), "end_date": build_time_str( values['-END_DATE-'], values['-END_HOUR-'], values['-END_MINUTE-'], values['-END_SECOND-'] ), "schedule": config.get('schedule', {}), "stay_duration": config.get('stay_duration', 60) } try: with open(CONFIG_FILE, 'w') as f: json.dump(new_config, f, indent=4, ensure_ascii=False) sg.popup('配置保存成功!', title='保存结果') except Exception as e: sg.popup_error(f'保存失败: {str(e)}') # 运行自动化 if event == '运行': print("启动浏览器自动化...") threading.Thread( target=browser_automation, args=(values, current_order), daemon=True ).start() # 打开设置窗口 if event == '设置': show_settings_window(window) # 定时设置 if event == '-SCHEDULE-': show_schedule_settings(window, config) # 清理资源 window.close() if SCHEDULER and SCHEDULER.running: SCHEDULER.shutdown() def calculate_dynamic_date(preset): if not preset or preset == "--": return None week_type, weekday_str = preset[:1], preset[1:] week_offset = -1 if week_type == "上" else 0 try: weekday_index = WEEKDAYS.index(weekday_str) except ValueError: return None today = datetime.now(BEIJING_TZ) current_week_monday = today - timedelta(days=today.weekday()) target_week_monday = current_week_monday + timedelta(weeks=week_offset) return target_week_monday + timedelta(days=weekday_index) def show_schedule_settings(parent_window, config): schedule = config.get('schedule', {}) def split_preset_time(time_str): if time_str and re.match(r"\d{2}:\d{2}:\d{2}", time_str): return time_str.split(":") return ["00", "00", "00"] start_time_parts = split_preset_time(schedule.get('start_preset_time', "00:00:00")) end_time_parts = split_preset_time(schedule.get('end_preset_time', "00:00:00")) layout = [ [sg.Text('开始日期预设:'), sg.Combo(["--"] + [f"上{day}" for day in WEEKDAYS] + [f"本{day}" for day in WEEKDAYS], default_value=schedule.get('start_preset', '--'), key='-START_PRESET-', enable_events=True, size=(12, 1)), sg.Text("时间:"), sg.Spin([f"{i:02}" for i in range(24)], start_time_parts[0], key='-START_PRESET_H-', size=3), sg.Text(':'), sg.Spin([f"{i:02}" for i in range(60)], start_time_parts[1], key='-START_PRESET_M-', size=3), sg.Text(':'), sg.Spin([f"{i:02}" for i in range(60)], start_time_parts[2], key='-START_PRESET_S-', size=3), sg.Text("实际日期:", size=(10, 1)), sg.Text("", key='-REAL_START-', size=15)], [sg.Text('结束日期预设:'), sg.Combo(["--"] + [f"上{day}" for day in WEEKDAYS] + [f"本{day}" for day in WEEKDAYS], default_value=schedule.get('end_preset', '--'), key='-END_PRESET-', enable_events=True, size=(12, 1)), sg.Text("时间:"), sg.Spin([f"{i:02}" for i in range(24)], end_time_parts[0], key='-END_PRESET_H-', size=3), sg.Text(':'), sg.Spin([f"{i:02}" for i in range(60)], end_time_parts[1], key='-END_PRESET_M-', size=3), sg.Text(':'), sg.Spin([f"{i:02}" for i in range(60)], end_time_parts[2], key='-END_PRESET_S-', size=3), sg.Text("实际日期:", size=(10, 1)), sg.Text("", key='-REAL_END-', size=15)], [sg.Text('定时执行:'), sg.Combo(["--"] + WEEKDAYS, default_value=schedule.get('schedule_type', '--'), key='-SCHEDULE_TYPE-', size=(8, 1)), sg.Input(schedule.get('schedule_time', '00:00:00'), key='-SCHEDULE_TIME-', size=(8, 1), tooltip="格式: HH:MM:SS")], [sg.Button('保存'), sg.Button('清除定时'), sg.Button('取消')], ] window = sg.Window('定时设置', layout, finalize=True) def update_dates(): start_date = calculate_dynamic_date(window['-START_PRESET-'].get()) end_date = calculate_dynamic_date(window['-END_PRESET-'].get()) window['-REAL_START-'].update(start_date.strftime('%Y-%m-%d') if start_date else "") window['-REAL_END-'].update(end_date.strftime('%Y-%m-%d') if end_date else "") update_dates() while True: event, values = window.read(timeout=500) if event in (None, '取消'): break if event == '清除定时': window['-START_PRESET-'].update('--') window['-END_PRESET-'].update('--') window['-SCHEDULE_TYPE-'].update('--') window['-SCHEDULE_TIME-'].update('00:00:00') window['-REAL_START-'].update('') window['-REAL_END-'].update('') config['schedule'] = { "start_preset": "--", "end_preset": "--", "schedule_type": "--", "schedule_time": "00:00:00" } with open(CONFIG_FILE, 'w') as f: json.dump(config, f, ensure_ascii=False) global SCHEDULER if SCHEDULER and SCHEDULER.running: SCHEDULER.shutdown() SCHEDULER = None sg.popup("定时设置已重置") if event in ('-START_PRESET-', '-END_PRESET-', 'TIMEOUT'): update_dates() if event == '保存': try: start_h = int(values['-START_PRESET_H-']) start_m = int(values['-START_PRESET_M-']) start_s = int(values['-START_PRESET_S-']) end_h = int(values['-END_PRESET_H-']) end_m = int(values['-END_PRESET_M-']) end_s = int(values['-END_PRESET_S-']) if not (0 <= start_h <= 23 and 0 <= end_h <= 23): raise ValueError("小时需在00-23之间") if not (0 <= start_m <= 59 and 0 <= end_m <= 59): raise ValueError("分钟需在00-59之间") if not (0 <= start_s <= 59 and 0 <= end_s <= 59): raise ValueError("秒数需在00-59之间") except ValueError as e: sg.popup_error(f"时间输入错误: {str(e)}") continue config['schedule']['start_preset_time'] = f"{values['-START_PRESET_H-']}:{values['-START_PRESET_M-']}:{values['-START_PRESET_S-']}" config['schedule']['end_preset_time'] = f"{values['-END_PRESET_H-']}:{values['-END_PRESET_M-']}:{values['-END_PRESET_S-']}" if values['-START_PRESET-'] != "--": parent_window['-START_HOUR-'].update(values['-START_PRESET_H-']) parent_window['-START_MINUTE-'].update(values['-START_PRESET_M-']) parent_window['-START_SECOND-'].update(values['-START_PRESET_S-']) if values['-END_PRESET-'] != "--": parent_window['-END_HOUR-'].update(values['-END_PRESET_H-']) parent_window['-END_MINUTE-'].update(values['-END_PRESET_M-']) parent_window['-END_SECOND-'].update(values['-END_PRESET_S-']) if not re.match(r'^([0-1]\d|2[0-3]):[0-5]\d:[0-5]\d$', values['-SCHEDULE_TIME-']): sg.popup_error("时间格式应为HH:MM:SS") continue start_preset_val = values['-START_PRESET-'] end_preset_val = values['-END_PRESET-'] calculated_start = calculate_dynamic_date(start_preset_val) calculated_end = calculate_dynamic_date(end_preset_val) if start_preset_val != "--" and calculated_start: date_part = calculated_start.strftime('%Y-%m-%d') # 更新主窗口的开始日期输入框 parent_window['-START_DATE-'].update(date_part) # 同时更新配置中的日期部分 config[ 'start_date'] = f"{date_part} {values['-START_PRESET_H-']}:{values['-START_PRESET_M-']}:{values['-START_PRESET_S-']}" if end_preset_val != "--" and calculated_end: date_part = calculated_end.strftime('%Y-%m-%d') # 更新主窗口的结束日期输入框 parent_window['-END_DATE-'].update(date_part) # 同时更新配置中的日期部分 config[ 'end_date'] = f"{date_part} {values['-END_PRESET_H-']}:{values['-END_PRESET_M-']}:{values['-END_PRESET_S-']}" config['schedule'] = { "start_preset": start_preset_val, "end_preset": end_preset_val, "schedule_type": values['-SCHEDULE_TYPE-'], "schedule_time": values['-SCHEDULE_TIME-'] } with open(CONFIG_FILE, 'w') as f: json.dump(config, f, ensure_ascii=False) setup_scheduler(parent_window) sg.popup("定时设置已保存！") window.close() def setup_scheduler(parent_window): global SCHEDULER if SCHEDULER and SCHEDULER.running: SCHEDULER.shutdown() config = load_config() schedule = config.get('schedule', {}) if schedule.get('schedule_type') == "--" or not schedule.get('schedule_time'): return SCHEDULER = BackgroundScheduler(timezone=BEIJING_TZ) def scheduled_task(): try: now = datetime.now(BEIJING_TZ) print(f"\n[{now.strftime('%Y-%m-%d %H:%M:%S')}] 定时任务启动") parent_window.write_event_value('执行定时任务', None) except Exception as e: print(f"定时任务异常: {str(e)}") try: h, m, s = map(int, schedule['schedule_time'].split(':')) weekday_index = WEEKDAYS.index(schedule['schedule_type']) SCHEDULER.add_job( scheduled_task, 'cron', day_of_week=weekday_index, hour=h, minute=m, second=s, misfire_grace_time=60 ) SCHEDULER.start() next_run = SCHEDULER.get_jobs()[0].next_run_time.astimezone(BEIJING_TZ) print(f"定时任务已激活，每周{WEEKDAYS[weekday_index]} {schedule['schedule_time']} 执行") print(f"下次执行时间: {next_run.strftime('%Y-%m-%d %H:%M:%S')}") except Exception as e: sg.popup_error(f"定时设置错误: {str(e)}") def browser_automation(values, current_order): try: if current_order is None: config = load_config() current_order = config["order"] config = load_config() STAY_DURATION = config.get('stay_duration', 60) schedule = config.get('schedule', {}) start_date = values['-START_DATE-'] start_time = f"{values['-START_HOUR-']}:{values['-START_MINUTE-']}:{values['-START_SECOND-']}" full_start = f"{start_date} {start_time}" if start_date else "" end_date = values['-END_DATE-'] end_time = f"{values['-END_HOUR-']}:{values['-END_MINUTE-']}:{values['-END_SECOND-']}" full_end = f"{end_date} {end_time}" if end_date else "" if not start_date or not end_date: print("错误：日期预设配置无效") return print(f"当前日期范围: {full_start} 至 {full_end}") service = EdgeService(r"C:\Program Files (x86)\Microsoft\Edge\Application\msedgedriver.exe") options = EdgeOptions() options.use_chromium = True driver = webdriver.Edge(service=service, options=options) modified_values = values.copy() modified_values['-FULL_START-'] = full_start modified_values['-FULL_END-'] = full_end driver.get(values['-URL-']) time.sleep(2) for label in current_order: element_config = config['elements'].get(label, {}) if element_config and element_config.get('identifier'): handle_element(driver, label, element_config, modified_values) time.sleep(0.5) print("自动化操作成功完成！") print(f"网页将保持打开状态{STAY_DURATION}秒...") time.sleep(STAY_DURATION) except Exception as e: print(f"执行过程中发生错误: {str(e)}") if 'driver' in locals(): driver.save_screenshot(f'error_{int(time.time())}.png') finally: if 'driver' in locals(): driver.quit() print("浏览器已关闭") def handle_element(driver, label, element_config, config): element_type = ELEMENT_TYPES[element_config['type']] identifier = element_config['identifier'] clean_identifier = identifier.replace(' ', '') schedule_config = config start_identifier = schedule_config.get('start_identifier', '开始时间') end_identifier = schedule_config.get('end_identifier', '结束时间') try: if element_type == 'button': xpath = f"//div[translate(normalize-space(), ' ', '') = '{clean_identifier}']" element = WebDriverWait(driver, 20).until(EC.element_to_be_clickable((By.XPATH, xpath))) driver.execute_script("arguments[0].scrollIntoView({block: 'center'});", element) driver.execute_script("arguments[0].click();", element) elif element_type == 'checkbox': xpath = f"//span[translate(normalize-space(), ' ', '')='{clean_identifier}']/preceding-sibling::input[@type='checkbox']" checkbox = WebDriverWait(driver, 20).until(EC.presence_of_element_located((By.XPATH, xpath))) if not checkbox.is_selected(): driver.execute_script("arguments[0].click();", checkbox) elif element_type == 'radio': xpath = f"//input[@type='radio']/following-sibling::text()[contains(., '{identifier}')]/preceding::input[1]" radio = WebDriverWait(driver, 20).until(EC.presence_of_element_located((By.XPATH, xpath))) driver.execute_script("arguments[0].click();", radio) elif element_type == 'dropdown': xpath = f"//span[translate(normalize-space(), ' ', '')='{clean_identifier}']/following::select[1]" select_element = WebDriverWait(driver, 20).until(EC.presence_of_element_located((By.XPATH, xpath))) Select(select_element).select_by_index(0) elif element_type == 'tab': xpath = f"//div[contains(@class,'tab')]/span[translate(normalize-space(), ' ', '')='{clean_identifier}']" tab = WebDriverWait(driver, 20).until(EC.element_to_be_clickable((By.XPATH, xpath))) driver.execute_script("arguments[0].click();", tab) time.sleep(1) elif element_type == 'time': xpath = f"//span[translate(normalize-space(), ' ', '')='{clean_identifier}']/following::input[1]" field = WebDriverWait(driver, 20).until(EC.presence_of_element_located((By.XPATH, xpath))) schedule_config = config.get('schedule', {}) start_id = schedule_config.get('start_identifier', '开始时间') end_id = schedule_config.get('end_identifier', '结束时间') if element_config['identifier'] == start_id: full_value = config.get('-FULL_START-', '') elif element_config['identifier'] == end_id: full_value = config.get('-FULL_END-', '') else: print(f"未配置的时间字段: {element_config['identifier']}") return attempts = [] if full_value: attempts.append(full_value) if ' ' in full_value: attempts.append(full_value.split(' ')[0]) attempts.append(full_value.split(' ')[1]) success = False for attempt in attempts: try: field.clear() field.send_keys(attempt) time.sleep(0.5) current_value = field.get_attribute('value') if current_value.strip() == attempt.strip(): success = True break except Exception as e: print(f"尝试输入 '{attempt}' 失败: {str(e)}") continue if not success: raise ValueError(f"无法输入日期时间: {full_value}") elif element_type == 'text': try: # 查找包含标识文本的元素 base_element = WebDriverWait(driver, 20).until( EC.presence_of_element_located( (By.XPATH, f"//*[contains(text(), '{identifier}')]")) ) # 查找最近的输入框（前、后或父级相邻） input_element = base_element.find_element(By.XPATH, "./following-sibling::input | " + "./preceding-sibling::input | " + "../following-sibling::input | " + "ancestor::div/following-sibling::input" ) # 清空并输入文本 input_element.clear() input_element.send_keys(element_config.get('text', '')) print(f"成功输入文本: {element_config['text']}") except Exception as e: print(f"查找输入框失败: {str(e)}") raise return print(f"成功处理: {label}") except Exception as e: print(f"处理 {label} 时出错: {str(e)}") raise if name == "main": create_gui() 以上代码的删除功能键点击无效，点击上下移动界面闪退，修改

首先，我得仔细看看用户提供的代码，特别是处理这些事件的逻辑部分。首先看删除功能。在代码中，处理删除事件的部分是在主事件循环中的if '_DEL-' in event:这个条件判断里。...比如，可能标签（label）的获取方式...

APScheduler-3.0.3.7z

2. **导入库**：在Python脚本中，首先需要导入APScheduler模块，如from apscheduler.schedulers.blocking import BlockingScheduler，这将加载一个阻塞式的调度器，即主程序会等待所有调度的任务执行完毕。...

APScheduler-3.9.1.post1-py2.py3-none-any.whl.zip

from apscheduler.schedulers.blocking import BlockingScheduler def job(): print("Hello, world!") scheduler = BlockingScheduler() scheduler.add_job(job, 'interval', minutes=1) scheduler.start() ...

技术文章系列整理（持续更新）

本博客有很多关于性能及测试开发的文章。我试着对你可能感兴趣的一些重要文章进行分类。性能基础系列：性能基础之浅谈常见接口性能压测性能闲谈系列：浅谈window桌面GUI技术及图像渲染性能测试实践 JMeter系列： Jmeter接口测试demo 性能工具之Jmeter扩展函数及压测ActiveMQ实践性能工具之Jmeter压测Hprose RPC服务性能工具之Jmeter压测Thrift...

基于卷积神经网络技术的人脸识别研究与应用

资源下载链接为： https://pan.quark.cn/s/56c4e4f964a7 基于卷积神......

apscheduler.schedulers

相关推荐

APScheduler.pptx

基于多进程中APScheduler重复运行的解决方法

APScheduler-3.1.0.tar.gz

from apscheduler.schedulers.background import BackgroundScheduler ModuleNotFoundError: No module named 'apscheduler.schedulers.background'

python 中 apscheduler.schedulers.blocking如何安装

from apscheduler.schedulers.blocking import BlockingScheduler 介绍一下，具体举例说明

ModuleNotFoundError: No module named 'apscheduler.jobstores.django'

PyPI 官网下载 | APScheduler-3.6.2.tar.gz

APScheduler-3.0.3.7z

APScheduler-3.9.1.post1-py2.py3-none-any.whl.zip

技术文章系列整理（持续更新）

基于卷积神经网络技术的人脸识别研究与应用

大家在看

Phase2教程.rar

MarcConverter

【原创】SharpDX第一个Winform窗口

HL340/USB-serial CH340 XP driver

ISO/IEC 27005:2022 英文原版

最新推荐

基于QT的调色板

基于springboot二手物品交易网站系统【附万字论文+PPT+包部署+录制讲解视频】.zip

基于Python的学生宿舍管理系统的设计与实现+数据库文档

深入学习循环神经网络（RNN）的方法与技巧

MATLAB神经网络优化算法

美国国际航空交通数据分析报告(1990-2020)

统计学视角：深入理解最小二乘法的概率论基础

vscode中使用Codeium

UniMoCo：统一框架下的多监督视觉学习方法

【MATLAB算法精讲】：最小二乘法的实现与案例深度分析