流程发现推荐系统:原理、实现与评估
立即解锁
发布时间: 2025-08-20 01:49:52 阅读量: 1 订阅数: 5 


业务流程管理:第12届国际会议论文集
### 流程发现推荐系统:原理、实现与评估
#### 1. 引言
在流程发现领域,为特定事件日志选择最佳的发现技术是一项具有挑战性的任务。不同的发现技术在不同的日志特征和评估指标下表现各异。本文将介绍一种流程发现推荐系统,它能够根据事件日志的特征和评估指标,为用户推荐最佳的发现技术。
#### 2. 评估指标
为了评估不同发现技术的性能,我们定义了以下几类评估指标:
| 类别 | 指标 | 描述 |
| --- | --- | --- |
| 性能 | 运行时间、使用内存 | 量化发现算法在特定事件日志上的执行情况 |
| 简单性 | 模型元素数量、节点弧度数、割点 | 量化发现算法结果(从特定事件日志中挖掘的过程模型)的可读性和可理解性 |
| 适应性 | 基于令牌的适应性、负事件召回率 | 量化日志中描述的行为与过程模型中表示的行为的符合程度 |
| 精确性 | ETC 精确性、负事件精确性 | 量化过程模型中表示的行为在日志中描述的程度 |
| 泛化性 | 负事件泛化性 | 量化超出观察到的行为的抽象程度 |
#### 3. 推荐 top-k 最佳技术
推荐特定事件日志的 top-k 最佳执行技术基于一组排名预测。排名预测确定了在特定指标下预期表现更好的技术。这些信息通过预测模型计算得出,预测模型是根据发现和一致性实验的结果构建的。最终排名综合考虑一个或多个排名预测,从而确定 top-k 最佳执行技术。从最终排名中选择 top-k 技术可以看作是一个典型的信息检索问题。
#### 4. 系统实现
推荐系统基于服务器 - 客户端架构实现:
- **服务器**:生成关于不同事件日志上技术性能的知识。包括评估框架和存储库,支持推荐系统的训练功能。训练功能和评估框架作为 CoBeFra 框架的一个包实现,存储库由事务性数据库支持。
- **客户端**:基于服务器生成的知识,为给定的事件日志预测(推荐)最佳执行技术。该功能作为 ProM 插件实现(适用于 ProM 6)。
评估框架依赖于一组发现和一致性算法,当前包含 9 种发现技术和 8 种一致性检查算法。以下是发现技术及其结果的列表:
| 技术 | 结果 |
| --- | --- |
| Alpha Miner | Petri Net |
| Flexible Heuristics Miner | Causal Net |
| Flower Miner | Petri Net |
| Fuzzy Miner | Fuzzy Model |
| Heuristics Miner | Causal Net |
| Inductive Miner | Petri Net |
| ILP Miner | Petri Net |
| Passage Miner | Petri Net |
| TS Miner | Transition System |
同时,评估框架还依赖于一组特征提取器,用于计算事件日志的特定特征。以下是可计算的特征列表:
| 范围 | 特征 | 描述 |
| --- | --- | --- |
| 轨迹 | 不同轨迹数量 | 日志中不同轨迹的数量 |
| 轨迹 | 总轨迹数量 | 日志中轨迹的数量 |
| 轨迹 | 轨迹长度 | 日志中所有轨迹的平均长度 |
| 轨迹 | 轨迹内事件重复次数 | 轨迹内事件重复的平均次数 |
| 事件 | 不同事件数量 | 日志中不同事件的数量 |
| 事件 | 总事件数量 | 日志中事件的数量 |
| 事件 | 起始事件数量 | 日志中不同起始事件的数量 |
| 事件 | 结束事件数量 | 日志中不同结束事件的数量 |
| 流程 | 熵 | 日志中两个事件之间直接后继和前驱计数比例的平均值 |
| 流程 | 并发性 | 基于依赖度量,因果矩阵中并发关系的百分比 |
| 流程 | 密度 | 因果矩阵中非零值的百分比 |
| 流程 | 长度为 1 的循环数量 | 因果矩阵中长度为 1 的循环数量 |
系统具有灵活性和可扩展性,任何技术、指标或特征都可以随时添加或删除,即使在实验执行过程中也可以。这些修改将在后续的训练迭代中生效。
#### 5. 评估框架功能
评估框架作为 CoBeFra 框架的一个包实现,并由 MySQL 数据库管理系统支持,具有以下功能:
- **管理功能**:控制存储库以及发现和一致性算法的集合。存储库是一个数据库,存储有关事件日志、过程模型和实验的信息。发现和一致性算法是可执行文件(如 ProM 插件),用于流程发现或一致性检查。
- **执行功能**:通过从存储库和算法集合中随机选择一个事件日志、一个控制流算法(即技术)和一个一致性算法来执行单个评估。评估开始时,要么执行发现实验以使用所选发现技术在所选日志上挖掘过程模型,要么如果该发现实验在先前的评估中已经执行,则从数据库中检索该过程模型。发现实验的执行包括在所选日志上运行所选控制流算法,计算过程模型和性能指标,并将两者存储在数据库中。然后,如果可能,继续执行一致性实验,即在所选日志和挖掘的模型上运行所选一致性算法,计算指标并存储在数据库中。
0
0
复制全文
相关推荐










