流程发现推荐系统:解决算法选择难题
立即解锁
发布时间: 2025-08-20 01:49:52 阅读量: 1 订阅数: 5 


业务流程管理:第12届国际会议论文集
### 流程发现推荐系统:解决算法选择难题
#### 1. 引言
在信息系统中监控流程执行会产生大规模的事件日志文件,而流程挖掘方法可以处理这些文件,它融合了商业智能和数据挖掘技术,是大数据时代支持信息系统的理想选择。
流程挖掘主要包括流程发现、一致性检查和增强。流程发现旨在对事件日志背后的业务流程进行行为建模;一致性检查用于检查流程模型与事件日志集的兼容性;增强则是基于事件日志中的额外信息丰富流程模型。
然而,流程发现是流程挖掘中最具挑战性的问题。虽然已经提出了多种流程发现算法,但没有一种算法能在所有情况下占据主导地位,而且这些算法大多需要接近专家的知识才能令人满意地应用。这给用户带来了难题:一方面,经验不足的用户难以从算法组合中获得最佳效果;另一方面,经验丰富的用户可能需要手动检查事件日志来选择合适的算法,这一过程繁琐、耗时且容易出错。
#### 2. 相关工作
为了解决上述问题,需要结合三个不同的学科来构建推荐系统。
##### 2.1 流程发现算法评估
控制流发现算法专注于找出流程中活动的因果关系,如顺序、冲突、并发、迭代等。可以使用一致性技术评估这些算法或其生成的模型,以揭示观察到的行为和建模行为之间的不匹配。不同的研究提出了多种评估流程挖掘算法的方法,如生成参考模型的事件日志进行一致性分析,基于参考模型和挖掘模型之间的行为和结构相似性评估算法等。
##### 2.2 协同过滤
由于选项众多,在不彻底检查可用选项的情况下很难确定个人选择。推荐系统是高效完成此任务的自动化方法,其中协同过滤是从用户早期对项目的偏好角度来解决推荐问题。算法推荐系统(ARS)使用协同过滤进行算法组合选择,它将用户 - 项目矩阵的概念应用于实例 - 算法矩阵,指示每个算法在每个实例上的性能。与其他一些算法选择方法不同,ARS 不需要完整的性能矩阵,并且具有通用结构,可以作为黑盒方法用于任何算法选择任务。
##### 2.3 信息检索
信息检索(IR)是在文档中查找最符合给定标准(如关键字)的信息的学科。在本文提出的框架中使用了 top - k 查询技术,即搜索多维数据集中最相关(或有趣)的 k 个条目。阈值算法是最早的高效 top - k 查询算法,而 Akbarinia 等人提出的基于索引的算法利用数据集中条目的位置来计算精确的 top - k 结果,本文使用其中的 BPA2 算法来检索 top - k 发现技术。
#### 3. 整体框架
流程发现推荐系统可以采用基于组合的算法选择策略。该策略依赖于一组算法,这些算法在输入对象(如数据集或问题)的存储库上执行,通过执行信息(如性能或结果)来确定针对特定输入对象的最佳算法。通过将这些对象特征化,可以构建一个预测模型,将算法排名与特征关联起来。
以下是评估流程发现技术的框架:
```mermaid
graph
```
0
0
复制全文
相关推荐










